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Введение 


Это учебное пособие написано на базе лекций, читавшихся на факультете 
технической кибернетики Санкт-Петербургского государственного политех- 
нического университета. Их основы более тридцати лет назад были заложены 
профессором Ю. В. Ракитским, а затем многократно перерабатывались и 
расширялись авторами. 


В настоящее время имеется достаточное количество учебников с названием 
"Численные методы" или похожим на него. В первую очередь, следует отме- 
тить книгу Н. С. Бахвалова и др. [1], построенную на основе лекций, читав- 
шихся на механико-математическом факультете и факультете вычислитель- 
ной математики и кибернетики МГУ. Этот весьма фундаментальный и 
обстоятельный курс характеризуется большой продолжительностью и соче- 
тает необходимую строгость изложения с обсуждением многих реально воз- 
никающих на практике проблем. В качестве предыдущей версии универси- 
тетского курса следует упомянуть книгу И. С. Березина и Н. П. Жидкова [2, 
3]. Имеется также большое число книг, в основном, для студентов инженер- 
ных специальностей, где авторы приводят многочисленные методы, к сожа- 
лению, без должного обоснования, ориентируя читателей на использование 
стандартных программ. 


В предлагаемом учебном пособии, предназначенном для студентов и аспи- 
рантов технических вузов, авторы пытались достичь определенного компро- 
мисса между этими двумя подходами и одновременно преследовали сле- 
дующие цели. Во-первых, везде, где возможно, сохранить разумную 
строгость изложения, указать способ построения того или иного метода и 
сократить ситуации, когда алгоритмы решения задачи приводятся без выво- 
да. Во-вторых, максимально полно познакомить читателя с основными труд- 
ностями, возникающими на практике при решении обсуждаемой проблемы. 
Так, например, важное место в пособии занимают проблема плохой обуслов- 
ленности при решении линейных систем алгебраических уравнений, явление 
жесткости в дифференциальных уравнениях и явление овражности при ми- 
нимизации функций, имеющие в своей основе немало общего и заставляю- 
щие расплачиваться либо точностью решения, либо большим объемом вы- 
числений. В-третьих, дать первое представление о том, как строится 
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программное обеспечение для обсуждаемых методов. За основу и в качестве 
примера были взяты программы из книги Дж. Форсайта, М. Малькольма, 
К. Моулера "Машинные методы математических вычислений" [14]. И, хотя 
на русском языке был издан ее переработанный и расширенный вариант [7], 
без ущерба для понимания основных проблем предпочтение было отдано 
[14] в связи с публикацией полного текста всех используемых программ не- 
посредственно в книге. В-четвертых, ставилась цель построить изложение 
так, чтобы оно отвечало курсу объемом порядка тридцати лекций. 


Перечисленные цели во многом противоречили друг другу, и достигнутый 
компромисс целиком определялся субъективными взглядами авторов. Так, 
например, материал, посвященный методам решения систем линейных ал- 
гебраических уравнений и уравнений в частных производных, следует счи- 
тать лишь введением в эти разделы. Более подробно они изложены в учебни- 
ках, приведенных в списке литературы. Оговоренное количество лекций не 
позволило отразить такие безусловно важные проблемы, как работа с разре- 
женными матрицами и параллельные вычисления. Для самостоятельного о3з- 
накомления с ними можно рекомендовать книги [38, 26, 55, 21, 35] идр. 


Для сокращения объема учебного пособия часто не делалось специальных 
оговорок в отношении свойств используемых функций. Например, если ка- 
кая-то функция дифференцируется или интегрируется, то по умолчанию 
предполагается, что она обладает всеми необходимыми свойствами для вы- 
полнения этих операций. 


В тексте пособия содержится некоторое количество вопросов для читателя. 
Об ответах на них при первом чтении можно не задумываться. Однако более 
серьезная работа над лекциями заставит вернуться к ответам для уточнения и 
закрепления полученных знаний. В ряде случаев вопросы носят откровенно 
провокационный и даже математически некорректный характер и не имеют 
однозначного ответа. Здесь основная цель — заставить студента задуматься и 
самостоятельно осмыслить обсуждаемые проблемы. 


Предполагается, что читатель знаком с курсом высшей математики в тради- 
ционном объеме для технического вуза, а также с материалами, размещен- 
ными в приложениях. При самостоятельном изучении пособия мы рекомен- 
дуем начинать с материалов первых четырех приложений. Когда пособие 
используется при чтении лекций, сведения из приложений можно излагать 
частями по мере возникновении в них потребности в остальных главах. 


В приложении 5 отражены примеры упражнений, лабораторных и курсовых 
работ, предусмотренных учебными планами. Традиционно такая проблема- 
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тика требует самостоятельных методических указаний большого объема с 
детальной проработкой. В данном случае авторы пытались лишь проиллюст- 
рировать возможное наполнение практических занятий и тем самым помочь 
студенту, самостоятельно изучающему пособие, а также молодому препода- 
вателю. 


Приводимый список литературы существенно ограничен и не претендует на 
полноту. С одной стороны, это перечень "универсальных" учебников, ориен- 
тированных на разнообразные численные методы широкого круга задач [1— 
15]. С другой стороны, у вдумчивого и пытливого читателя часто возникает 
вопрос: "А что еще можно почитать на эту тему?" Для этих студентов мы и 
делаем ссылки, также не претендующие на полноту: 


глава 2 — [48, 46, 19, 20, 25, 29, 30, 36, 39, 47, 49]; 
глава 3 — [34, 27]; 

глава 4 — [50, 51, 16, 33, 40, 42, 43, 52]; 

глава 5 — [18, 24, 27, 37, 40, 54]; 

глава 6 — [32, 40, 45]; 

приложения — [23, 22, 46, 17, 31, 44, 53]. 


поочочц 


ГЛАВА 1 


Аппроксимация функций 
и смежные вопросы 


1.1. Общие сведения 


Этот раздел посвящен некоторым аспектам теории приближения функций. 
Термин "аппроксимация" (от лат. аррғохітағе — приближаться) в данном 
контексте трактуется как "замена". 


Прежде чем излагать какие-либо подходы к решению этой проблемы, целе- 
сообразно рассмотреть следующие вопросы. Что нужно заменять и зачем 
заменять? Чем заменять? Как количественно оценивать погрешность за- 
мены? Наконец, если есть несколько вариантов замены, то как выбрать из 
них наилучший? 


Итак, что заменять. На математическом языке это означает замену одной 
функциональной зависимости другой. Исходная функция чаще всего задается 
в одном из следующих видов: 


(С аналитически; 

С графически; 

О таблично; 

С алгоритмически. 


В последнем случае подразумевается, что аналитический вид функции неиз- 
вестен, но задан алгоритм (быть может, весьма сложный и трудоемкий), ста- 
вящий в соответствие любому значению аргумента х из области определения 
значение функции Х(х). Так как на практике часто возникает потребность 
дифференцировать, интегрировать /(х) или использовать ее в различных 


расчетах, то целесообразность замены /(х) другой функцией, имеющей ана- 
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литический вид, сомнений не вызывает. Даже если (х) задана аналитиче- 


ски, она может оказаться весьма сложной с позиций решаемой задачи, и тре- 
буется другая заменяющая ее функция. При выборе аппроксимирующей 
функции обычно руководствуются ее простым видом. 


Теоретическим обоснованием выбора заменяющей функции может служить 
теорема Вейерштрасса: если Ё(х) — произвольная непрерывная на конеч- 
ном замкнутом интервале [а, 2] функция, то для любого =>0 найдется та- 


кой полином Р, (х) степени п =и(=) ‚ что 
тах | /(х) ~ Р,(х)|<є. 


Однако эту теорему следует отнести к чистым теоремам существования. Она 
не дает гарантии, что такой полином можно построить с помощью практич- 
ного алгоритма. Тем не менее, именно полиномы являются наиболее попу- 
лярными заменяющими функциями, поскольку они удобны в работе и их 
свойства хорошо известны. Наряду с ними используют тригонометрические, 
экспоненциальные функции и т. д. В общем случае требования к простоте 
выдвигает решаемая задача. 


Для того чтобы можно было сравнивать различные варианты аппроксимации, 
следует ввести критерий близости. В частности, им может быть максимум 
модуля отклонения исходной функции /(х) от аппроксимирующей &(х) на 


заданном промежутке 
0 = тах Е 
хє[а, с 7? 805) ( 1.1.] ) 


или так называемый "среднеквадратичный критерий" 


Б 
р^ = [(70) – а(х)? ах. (1.1.2) 


а 


В том случае, когда /(х) определена таблично на заданном наборе точек, 
может быть использован дискретный аналог критерия (1.1.2): 


М 
р? (ц) - #6) (1.1.3) 


Лучшей оказывается аппроксимирующая функция, обладающая наименьшей 
величиной ӧ или р?. Для понимания дальнейшего полезно ответить на сле- 
дующие вопросы. 


Аппроксимация функций и смежные вопросы 7 


ВОПРОС 1 


Не являются ли критерии (1.1.1) и (1.1.2) весьма похожими, и если ап- 
проксимирующая функция #1(х) лучше, чем 22(х) по одному из крите- 
риев, то окажется ли она лучше и по другому? 

Легко заметить, что вопрос носит провокационный характер, о чем свиде- 


тельствует пример на рис. 1.1, когда лучшими по каждому критерию оказы- 
ваются различные функции. 


(х) 
51х) 


ни сте, 


х 


Рис. 1.1. Различные варианты аппроксимации 


ВОПРОС 2 


На практике какая из аппроксимирующих функций на рис. 1.1 пред- 
почтительнее, 21(х) или 22(х)? 


И опять вопрос носит провокационный характер, т. к. словосочетание "на 
практике" еще не задает критерий. Только решаемая задача диктует выби- 
раемый критерий близости, который, в свою очередь, позволяет выбрать 
лучшую аппроксимацию. 
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Теперь приступим к подробному изложению задачи интерполяции, основан- 
ной на интерполяционном критерии близости. 


1.2. Постановка задачи интерполирования 


Будем приближать исходную функцию, заданную таблично: 


ЕаЕЗЕЗЕЗСЕЯ 
оо 5: 269 Роа) | | Хы. 


обобщенным многочленом 


О„(х) = ауфо(х) + а фи (х) +...+а„ф,„(х) = У акф, (х), (1.2.1) 
к=0 


где нф І — заданный набор линейно независимых функций, а коэффициенты 


а, подлежат определению. При этом в качестве критерия близости выбира- 
ется совпадение значений /(х) и О„(х) в узлах таблицы 


О„(х,) = Л (х;), [= 0, 1, ае т. (1.2.2) 


Тогда О, (х) называется интерполяционным многочленом, а х, — узлами 


т 
интерполирования. 


Равенства (1.2.2) представляют собой систему линейных алгебраических 
уравнений относительно искомых коэффициентов обобщенного многочлена 
ау, а|,.... ат. Эта система имеет единственное решение, если ее определи- 


тель отличен от нуля. 


Ф0(%) Ф(х0) -.. Фи) 


Фо(х1) ФО) ... Ф,„(х) 


деї 5 0. 


Фо(хт) Фи) -.. Ф„ (х) 


Последний факт имеет место при любом упорядоченном наборе неповто- 
ряющихся узлов для системы линейно независимых функций {$}, если 
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все эти функции т+1 раз дифференцируемы на промежутке, где располо- 
жены узлы, и все определители Вронского 


Фо(х) Ф1() ... ФС) 


Фо(х) ф(х) .. ф(х) 
У (фобх), убх), .‚ ФС) = Р к 


к к к 
Ро) Ф) =. $00) 
отличны от нуля на [а, 5]. 


Наиболее популярной является полиномиальная аппроксимация, когда 
Ф, (х) = х^ ‚ О, (х) =ау+ах+ ах" +...+атх” , а определитель системы (1.2.2) 


приобретает вид 


Г ма х) 

1 х х хү 

Е. (1.2.3) 
2 п 

д а, Я; 


Этот определитель называется определителем Вандермонда. Он отличен от 
нуля, и задача имеет единственное решение, если узлы интерполирования ху, 


х,... х, различны. 


1.3. Интерполяционный полином Лагранжа. 
Остаточный член полинома Лагранжа 


Непосредственное численное решение линейной системы (1.2.2) представля- 
ет значительные трудности. С одной стороны, это связано с заметным объе- 
мом вычислений для нахождения а, . С другой стороны, малое изменение 


данных таблицы (х,, /(х;)) часто приводит к сильному изменению решения 


(особенно для близко расположенных узлов интерполирования). В связи с 
этим, естественно попытаться построить интерполяционный полином, не ре- 
шая системы (1.2.2). 
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В качестве базиса вместо ф(х) = х! выберем полиномы @5(х), © (х), ..., 


о „(х) такие, что они обращаются в нуль во всех узлах, кроме одного, когда 
индекс полинома совпадает с индексом узла: 


о(х) = (х хо)(х- х)... (х-х,,), (1.3.1) 
0;(х) = ЖОЕ =(х – хо)(х- (хх )(х Хеј )...(х —хи ). (1.3.2) 
(х-ж) 
В этих обозначениях запишем следующий полином: 
оо) = > 9000) (1.3.3) 
ко (Хь ) 


По построению это многочлен степени т. Определим его значения в узлах 
интерполирования х;. Так как для х= х; полином @,(х) равен нулю, если 


только і + ‚то для О„(х,) получаем 


О (х;) = УЕ А д ба 0; 1, зы: ЧИ: 


к—0 ок(х4) Ф«КХ;) 


Таким образом, О, (х) — интерполяционный полином, получивший название 


интерполяционный полином Лагранжа. 


ВОПРОС 3 


По заданной таблице при отсутствии ошибок округления построили 
два полинома. Коэффициенты первого нашли решением системы 
(1.2.2). Второй был непосредственно воспроизведен по формуле (1.3.3). 
Какой из этих полиномов лучше приближает исходную функцию? 


Интерполяционные многочлены можно строить и по другим системам базис- 
ных функций, например, таким как 


1, соѕЅх, зшх, соѕ2х, тах, ..., СОЅИХх, $тИХ , ... 


ох ,092х ох 
ее ыы 


Теперь обратимся к погрешности интерполяционного полинома. Исходная 
функция /(х) может быть представлена в виде 


ох) = 0, (х) + К, (5), (1.3.4) 
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где О„(х) — интерполяционный полином, а К 


„(х) носит название оста- 


точного члена интерполяционного полинома. Вид К, (х) получается на ос- 
нове известной теоремы Ролля, которая утверждает следующее. 


Если }(х) непрерывна на отрезке [а, |, имеет первую производную в каж- 


дой точке внутри этого отрезка, и значения функции на концах этого про- 
межутка равны, т. е. }(а) = } (Б), то внутри отрезка найдется, по крайней 


мере, одна такая точка х = с, что { (с) = 0. 


Теорема. Если /(х) на промежутке [а, Ь] имеет непрерывные производные 


вплоть до т +1 порядка, то остаточный член А, (х) можно представить в 
виде: 


(т) 


Ки(х) = 30) -О„(х) = (т + 1)! 


о(х), пе[а, 5]. (1.3.5) 


При этом о(х), как и прежде, определяется формулой (1.3.1). 


Доказательство. Рассмотрим вспомогательную функцию 

ф(2) = (2) –- О„ (2) – Ко(2), (1.3.6) 
где К — некоторая постоянная. Пусть х, — узлы интерполирования, а х — 
точка, в которой оценивается погрешность (х я х). Легко заметить, что 


функция Фф(2) равна нулю во всех узлах интерполирования. Выберем кон- 
станту К так, чтобы ф(х) = 0. 


0) -0,(х) _ нб) 


Е. с (1.3.7) 


Таким образом, ф(2) имеет по меньшей мере т + 2 нуля (все узлы интерпо- 
лирования и точка х). Тогда по теореме Ролля первая производная Фф(2) имеет 
по меньшей мере т +1 нуль, вторая производная — не менее т нулей, а 
(т+1) -я производная Ф("+ (2) имеет по меньшей мере один нуль. Обозна- 
чим точку, где (т+!)-я производная обращается в нуль за п. Тогда, 
последовательно дифференцируя (1.3.6), получаем 


фи) = п) -0-К(т+1!=0. 


Подставляя в это равенство выражение (1.3.7) для К, получаем формулу для 
К„(х) , совпадающую с (1.3.5). 
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Формула (1.3.5) позволяет сделать очевидный, но важный вывод. Пусть 


+1 
Л(х) — это полином степени т. Тогда ("+ (п) =0. Следовательно, поли- 


ном степени т однозначно воспроизводится интерполяционным полиномом 
по (т +1) точке. 


Ясно также, что остаточный член во всех узлах интерполирования равен нулю. 


В заключение отметим тот факт, что, хотя о расположении точки 1 на про- 


межутке интерполирования ничего не известно, очевидна зависимость вели- 
чины ў как от узлов интерполирования, так и от точки х, где оценивается 


погрешность, т. е. п = 1(х). 


Остаточный член позволяет оценивать отклонение Гбх) от (х) для диф- 


ференцируемых функций тогда, когда удается оценить Х "+1 (х). Полагая 


М „ц = тах у е0 (0), получим |А, О) < саа а (х х)|. 


1.4. Выбор узлов интерполирования 


Для уменьшения погрешности интерполирования обратимся к формуле 
(1.3.5) при заданной степени полинома т. Поскольку величиной /("+ (п) 
трудно управлять, и возможна лишь оценка пределов ее изменения, задача 


уменьшения погрешности сводится к управлению величиной ох) за счет 


выбора узлов интерполирования. Рассмотрим два типичных на практике слу- 
чая. 


Случай 1. Задана степень полинома т, и имеется таблица достаточно боль- 
Ы 24 
шой длины. Точка х , в которой вычисляется значение полинома, заранее 
* 
известна. Требуется выбрать т +1 узел так, чтобы величина іо(х ) была 
минимальной. Результат очевиден. Нужно выбирать узлы интерполирования 


из таблицы, ближайшие к х . Использование любого другого узла вместо 
ближайшего неизбежно увеличивает значение 


ог)" я) (=, 
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Случай 2. Заданы степень полинома т и промежуток интерполирования 
ж 

[а, Ь]. Точка х , в которой вычисляется значение полинома, заранее не из- 

вестна. Требуется выбрать узлы интерполирования так, чтобы в самом небла- 


ж 
гоприятном случае расположения х погрешность была минимальной (так 
называемый минимаксный критерий): 


тах оба" ) > тіп. 
ав (1.4.1) 


ВОПРОС 4 


ж 
С учетом того, что величина х заранее неизвестна и нет оснований от- 
давать предпочтение какой-либо части промежутка, как следует зада- 


вать узлы х; на [а, |? 


Интуитивно часто напрашивающееся предложение о равномерном задании 


ж 
узлов на промежутке оказывается ошибочным. Так как значения ох ) В 


ж 
узлах интерполирования равны нулю, график ох ) напоминает "колоколь- 


чики", максимум которых достигается между узлами иктерполирования. 
Одинакова ли высота этих "колокольчиков" на различных промежутках меж- 
ду узлами? Оказывается, что нет. Выбор узлов равноотстоящими с попыткой 


уравновесить погрешность на отдельных участках промежутка [а, | оказы- 
вается здесь неудачным, и точки, расположенные ближе к центру промежут- 
ка, попадают в привилегированное положение. Поясним это на примере. 


Расположим на промежутке [0, 5 равномерно 6 узлов с шагом й=1 (х, = Ё, 
К =0, 1, 2,3, 4, 5). 

ж 
Для точки х = 2.5 такие узлы, как это рассматривалось в случае 1, оказыва- 


ются наилучшими при единичном шаге 
([2(2.5)|= 2.5х1.5х0.5х0.5х1.5х 2.5 = 352) · В то же время для х =0.5 полу- 


чаем |00(0.5)|= 0.5х0.5х1.5х2.5х3.5х 4.5 = 14.77. Здесь в соответствии с ре- 
комендациями к случаю | вместо узлов х; =4 и х; = 5 следовало бы взять 
ближайшие узлы хц =-Ги х; =-2, но они в таблице отсутствуют. График 
|о(х)| ‚ представленный на рис. 1.2, не только отражает сказанное, но подска- 


зывает выход из создавшейся ситуации. Узлы интерполирования нужно сим- 
метрично сместить ближе к концам промежутка. Тогда высота центрального 
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"колокольчика" увеличится, в то время как высота крайних уменьшится. Оп- 
тимальный выбор узлов интерполирования отвечает нулям так называемых 
ортогональных полиномов Чебышева (о них речь пойдет позже), когда все 
"колокольчики" будут одинаковыми по высоте. Соответствующий график 
представлен на рис. 1.3, а значение х, определяются по формулам 


х; Е где $, о і = 0...т. (1.4.2) 
2 2 2т+ 2 
0.07 0.035 
0.06 0.03 
0.05 0.025 
0.04 0.02 
0.03 0.015 | 
0.02 0.01 | | 
0.01 0.005 
1 0 1 1 0 1 
Рис. 1.2. Равноотстоящие узлы Рис. 1.3. Чебышевские узлы 


1.5. Интерполяционный полином Ньютона 
для равно- и неравноотстоящих узлов 


Оценка погрешности непосредственно на основе формулы (1.3.5) выполняется 
крайне редко из-за известных трудностей, связанных с оценкой производной 


Л ("+1 (11), особенно для таблично заданной функции. Поэтому на практике о 


ж 
величине погрешности принято судить, сравнивая в заданнои точке х значе- 
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Ж ж ж 
ния интерполяционных полиномов соседних степеней О», (х и Ои (х ). 


При недостаточной точности последовательно повышают степень полинома. 
Но для такой процедуры использование полинома Лагранжа (1.3.3) оказывает- 
ся неэффективным. При переходе от полинома О„(х) к полиному О. (Хх) 
почти всю работу приходится выполнять заново. Действительно, добавление 
еще одного узла интерполирования связано не только с появлением дополни- 
тельного слагаемого в формуле (1.3.3), но и с перерасчетом всех остальных 
слагаемых в (1.3.3) из-за возникновения х„.|. Целесообразно записать поли- 
ном О,» .1(х) в таком виде, чтобы расчеты сводились к появлению лишь еще од- 
ного слагаемого в дополнение к ранее вычисленному 0, (х). С этой целью за- 


пишем первую разделенную разность (см. разд. 171.2): 


Р(х; ху) = Р(х) Хо) 
х- х0 
и выразим из нее / (х): 
Рх) = РО) +(х-хо) хо). (1.5.1) 


Легко заметить, что первое слагаемое в правой части — это интерполяцион- 
НЫЙ ПОЛИНОМ нулевой степени, а второе слагаемое — это погрешность поли- 
нома. 


Теперь запишем вторую разделенную разность 


выразим из нее первую разность через вторую и подставим в формулу (1.5.1) 
Го) = (хо) +(х- х0) (хо) +(х-хо)(х-х1) (хоз). (1.5.2) 


Продолжая этот процесс и выражая вторую разность через третью, третью 
через четвертую ит. д., получаем: 


Ро) = (хо) +(х-хо} Хм; ж)+(х-хо) (хх) (хоро) +...+ 
+(х-х0)(х-= х1). (хх) (хо 25.45 хт) + 
(ое Да оо е 


=0„(х) + (х) (х хоз хо; хи). 


(1.5.3) 
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Подставляя х= ху и х= ху в (1.5.2), убеждаемся в том, что первое слагаемое 


в правой части — это интерполяционный полином нулевой степени, а сумма 
первых двух слагаемых — это интерполяционный полином первой степени. 
Такая структура сохраняется и в (1.5.3). Сумма первых К слагаемых порож- 
дает интерполяционный полином степени А -1, а последнее слагаемое явля- 
ется погрешностью интерполяционного полинома степени т. При этом 
структура полинома такова, что полином степени т получается как полином 
степени т – 1 с добавлением еще одного слагаемого 


О (х) = Л(ж)+(х-хо) (хо) (х= хо) (хх) Л (ж;х; № )+...+ 
+(х-хо)(х-х1)...(х-хи-1). (охь) = (1.5.4) 
= 010) + (х-хо)(х-хи)-..(х-хи) (хохь). 


Этот полином в форме (1.5.4) и получил название интерполяционный поли- 
ном Ньютона. На практике вычисление разделенных разностей производится 
в рамках следующей таблицы, где появление новой разделенной разности 
более высокого порядка связано с построением еще одной диагонали (см. 
разд. П1.2). 


(х0; 50) (хоз хуз хз) | (хоз х 0503504) 
Од) ГО; 23) ГО; хо; 3:4) 
ЕЛЕЕ ЕСИН 
ИН Е 


Следующее весьма простое замечание дополняет вопрос 3. 


ВОПРОС 5 


По заданной таблице при отсутствии ошибок округления построили 
два полинома: полином Лагранжа (1.3.3) и полином Ньютона (1.5.4). 
Какой из этих полиномов лучше приближает исходную функцию? 
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Если относительно функции /(х) сделать те же предположения, что и в 


формулировке теоремы об остаточном члене интерполяционного полинома в 
форме Лагранжа, то на основе (1.3.5) и (1.5.3) можно записать 


(т+1) 
х, а Ў (1) 


хх Хх. Хо, М, Х..... хх 
(х) 7 (ху хоз хх т (х) 
ИЛИ 
"+ (п) 
Хх: хм. |= А 
ГА 071272 т (т +1)! 


и установить связь разделенной разности с производной. При т =0 эта фор- 
мула превращается в результат теоремы Лагранжа о конечном приращении 


(х) — }(хо) ' 
Охо) === (0). 
= Хо 
Полином Ньютона можно переписать в другой форме, если перенумеровать 
узлы интерполяции: 


О исходная нумерация: ху, ху, ..., х, х 


С новая нумерация: х„, х, _,..., х, №. 
В исходной нумерации полином (1.5.4) часто называют полиномом Ньютона 


для интерполирования вперед или в начале таблицы, а в новой нумерации — 
полиномом для интерполирования назад или в конце таблицы. 


При построении полинома Ньютона узлы таблицы могли задаваться произ- 
вольно. Важным и распространенным частным случаем является равномер- 
ное расположение узлов. Здесь вместо разделенных разностей можно исполь- 
зовать конечные разности и тем самым избежать деления разности значений 
функции на разность значений аргумента. 
Пусть х; = ху + АЙ, где й — постоянный шаг таблицы. Выполним замену пе- 
ременной х= хо + йі в (1.5.4), одновременно выражая разделенные разности 
через конечные по формуле (111.7). Учитывая, что 

х-хх Х-мМ-АЙ хм 

й й й 

получим версию полинома Ньютона для равноотстоящих узлов 


(1 


-к=1-– К, 


О„ (хо + №) = ат САУС хо) + АУ хо) +... + 


(1.5.5) 
ЛС Ез -т+1) 
Е БЫ 


А” (хо). 
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Новая независимая переменная / принимает в узлах таблицы целые значения, 
а вычисление конечных разностей реализуется подобно разделенным разно- 
стям по следующей таблице: 


СЕЗЕ и 
БЕЗ 
м 


Очевидно, что и полином Ньютона для интерполирования назад также можно 
записать в аналогичном виде, только замена переменной будет другой 
х= х +йа. Тогда 


х= х И. 


| 
Ол) = Ло) + А + 4-2 у т дн 
К (х) = рт 9(9 +1)04 + т) тн) т ). 
(т +1)! 


Рассмотренные интерполяционные полиномы не исчерпывают всего их мно- 
гообразия. Для различных целей могут быть использованы формулы Гаусса, 
Стирлинга, Бесселя и др., ознакомиться с которыми можно по приведенной 


литературе. 


1.6. Интерполирование сплайнами 


На практике интерполяционные полиномы высоких степеней строят крайне 
редко. В первую очередь, это связано с тем, что их коэффициенты очень чув- 
ствительны к погрешностям исходных данных. Сравнительно малое измене- 
ние узлов интерполирования х; или значений функции /(х;) приводит к 


сильному изменению вида самого полинома. В такой ситуации одним из воз- 
можных вариантов аппроксимации является разбиение большой исходной 
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таблицы на участки, для каждого из которых строится интерполяционный 
полином относительно невысокой степени. Этот подход используется, на- 
пример, при получении составных квадратурных формул, рассматриваемых 
далее. Однако в целом ряде приложений требуется, чтобы аппроксимирую- 
щая функция была гладкой, а функция, составленная из различных полино- 
мов, в узлах сопряжения не имела производной. Выходом из создавшегося 
положения является использование сплайн-интерполяции. 


Сплайн (от англ. 5рПие) — это длинная гибкая тонкая рейка, используемая 
чертежниками в качестве лекала для проведения гладких кривых через за- 
данные точки. Математическое осмысление этого инструмента и породило 
теорию сплайнов, аппарат которой заметно выходит за рамки описания меха- 
нического сплайна. Расположив чертеж в вертикальной плоскости и закрепив 
рейку, в узлах интерполяции к ней подвешивают грузила и добиваются, что- 
бы деформированная рейка совместилась со всеми точками. Сплайн прини- 
мает форму, отвечающую минимуму его потенциальной энергии, и линеари- 
зованное дифференциальное уравнение изогнутой оси рейки имеет вид 


ЕГ.5"(х) = -М(х), 


где Е] — жесткость материала рейки, 5(х) — ее прогиб, а М(х) — изгибаю- 
щий момент, линейно зависящий от координаты (М(х) ~ х ). Интегрирование 
этого уравнения показывает, что функция 5(х), описывающая профиль 


сплайна, является кубическим полиномом между любыми двумя соседними 
точками. Кроме этого, соседние полиномы соединяются непрерывно и гладко 
так же, как и их первые и вторые производные (рейка не разламывается). 


От механической иллюстрации перейдем к формальному аппарату сплайн- 
интерполяции. Обратимся к таблично заданной функции: 


[= Та = 
о рео тоо | 


Число узлов равно №, а их нумерация начинается с единицы. На каждом 


промежутке 57 | будем строить интерполяционный полином третьей 


степени 


5% (х)=а +В (х-х )+ су (х-х,) + а, (х-х,}. (1.6.1) 
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Количество полиномов, как и промежутков, равно М-1, и каждый полином 
имеет 4 параметра. Таким образом, всего в наличии 4№ ~ 4 параметра. По- 
требуем, чтобы во всех внутренних точках были равны значения соседних 
полиномов, их первых и вторых производных 


(Хи) = 9 (1) Е (Жи) = ЭХ} 


(1.6.2) 
®х (Хи+1) = 94105441); = 1, 15 М2, 


т. е. выполнялись суммарно 3(№ ~ 2) = З№ – 6 уравнений. Еще М№ уравнений 
отражают требования интерполирования 


(жк) =, К=Ь2,...М-1 85у (ху)= Ју. (1.6.3) 


Общее число задаваемых условий достигает 4№ – 6. При наличии 4№М-4 
параметров появляется возможность выполнить еще два условия. В их зада- 
нии нет острой необходимости, т. к. требования интерполирования и сопря- 
жения соседних полиномов уже выполнены, но это целесообразно сделать 
для однозначного решения задачи. Различные кубические сплайны отлича- 
ются друг от друга заданием этих двух требований, которые, как правило, 
записываются для двух крайних точек ху и ху. К этим двум дополнитель- 
ным условиям целесообразно предъявить следующие два требования. С од- 
ной стороны, их лучше задавать так, чтобы полная система уравнений реша- 
лась по возможности более просто. С другой стороны, они должны 
максимально соответствовать характеру поведения функции в начале и в 
конце промежутка интерполирования. Приведем два примера. 


Пример 1. 5}(х)=0; 5% (хм) = 0. Этот сплайн получил название естест- 


венного кубического сплайна. Однако такое название оправдывается, и вы- 
полнение второго требования имеет место только в механике, пока анализи- 
руется упомянутый механический сплайн. В общем случае равенство нулю 
второй производной на краях промежутка не является обязательным свойст- 
вом экспериментальных данных, отражаемых таблицей. 


Пример 2. По первым четырем точкам таблицы строится интерполяционный 
полином третьей степени О.(х), и его третья производная приравнивается 


третьей производной $ (х). Аналогично по последним четырем точкам стро- 


ится интерполяционный полином ((х), и его третья производная приравни- 


вается третьей производной последнего полинома 5»/_/(х) 


О"(х,) = 5"х,); О (х) = 5" (хм). (1.6.4) 
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Такие условия не только отвечают характеру поведения функции в начале и в 
конце промежутка интерполирования, но и достаточно просты (третья произ- 
водная от полинома третьей степени постоянна). Именно они и учитываются 
в рассматриваемых программах $РЬТМЕ и ЗЕУАТ. Процедура решения системы 
линейных алгебраических уравнений (1.6.2)—(1.6.4) для 4№ – 4 неизвестных 
коэффициентов полиномов (1.6.1) может быть заметно упрощена. Специаль- 
ная форма записи (1.6.1) уже позволяет сократить число неизвестных на чет- 
верть, т. к. из требования интерполирования сразу находятся неизвестные 
коэффициенты а; 


Зи (хь) =а = Л, К =1,2,..., М-1. (1.6.5) 


Для дальнейшего уменьшения объема вычислений запишем полиномы (1.6.1) 
на промежутке [х;, ху] в несколько ином виде. С этой целью введем обо- 


значения 
х= № Ех 
р = хрх, М= ‚ №=1- 
К К 


Хх = 
= К+] 


(1.6.6) 


Переменная у изменяется на [х х] от 0 до 1, а м — от 1 до 0. В этих 


обозначениях запишем 5, (х) в виде 


9.(х) = м 5 +и. ў, + Ар (и -*] он + (> -»)о, | (1.6.7) 


где о; и Ср — константы, подлежащие определению, = 1,..., № – 1. 


Первые два слагаемых являются интерполяционным полиномом первой сте- 
пени и обеспечивают тем самым требования интерполирования (5, (х) = №, 
54 (Хь+1) = т), а также сопряжение соседних полиномов. Остальные сла- 


гаемые (1.6.7) в узлах интерполирования равны нулю. Их цель — обеспечить 
сопряжение первых и вторых производных соседних полиномов. 


Определим первые три производные 5,(х), учитывая, что м’ =1/й,, а 


ур = 1: 


5% (х)=( Дн - Л) |? Пон - (Зу - Вох | 


Е _ (1.6.8) 
50 (х) = бис +биср; 8," (х) = Зы 
к 
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П 
Непрерывность вторых производных (8 (х1) = 54.1 (хи +1) ) очевидна после 
подстановки в (1.6.8) х=х, и х= х. Осталось обеспечить сопряжение по 


первым производным. 


50 (жи) = (ла - Л) + А (26+ вк) = Лох) + А (2041+04, 
бен (хұн) =( 7.2 — Аа) Рн + ІРА (-сд+2 2с) = 


= (хұн х2) н (сдә ля 26-1) | 


Требование этого сопряжения ( 5% (х,у) = $. (хи!) ) приводит к следующей 


системе уравнений: 


ср + 20А +) ба + Рабо = ГО Хи) ЛОХ), 


1.6.9 
к =1|,2,...М-2. 


Осталось записать в этих же обозначениях уравнения (1.6.4) на краях проме- 
жутка интерполирования. В качестве 0О3(х) воспользуемся полиномом Нью- 
тона (1.5.4) третьей степени по первым четырем точкам, начиная с ху: 


Оъ(х) = Ля) + (хр) Л; )+(х-ж)(х-ж) Оов) +..+ 


+(х-м)}(х-х)(х-ж) Охо; әз). 


Дифференцируя его три раза (0, (ху) =6/(х;х;23;х4)) и учитывая (1.6.8), 
получаем для первого уравнения (1.6.4) 


—й о! + АС) = (жж ж ма). (1.6.10) 


Аналогично для второго уравнения (1.6.4), трижды дифференцируя полином 
Ньютона третьей степени по последним четырем точкам таблицы, имеем 


—й о + Дб = А2 Ох: жж) 
7 (1.6.11) 
Руб м-1 — Аудбу = =йу-17 (ху-35Ху-25Ху-5Х№). 
Уравнения (1.6.10) и (1.6.11) в совокупности с системой (1.6.9) образуют сис- 
тему из М№ алгебраических уравнений с № неизвестными сұ. При этом 


(1.6.10) является первым уравнением системы, а (1.6.11) — последним. Мат- 
рица такой системы является симметрической, трехдиагональной и диаго- 
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нально доминирующей (в каждой строке диагональный элемент больше сум- 
мы остальных элементов): 


-й Л 0 0 Р 0 
и 20А+) № 0 .. 0 
0 ъъ 20+) № Е 0 


0 Ям 22 +Ау р) Им 

0 0 Им йу 
Для решения линейных систем с трехдиагональной матрицей существует 
эффективный численный алгоритм, называемый методом прогонки и рас- 
сматриваемый далее в соответствующем разделе. Трудоемкость обычного 


метода Гаусса пропорциональна кубу размера матрицы, а для метода прогон- 
ки она лишь линейно зависит от числа уравнений системы. 


В силу целого ряда соображений, результаты решения системы уравнений 
относительно ср часто хранят в виде коэффициентов Ё,, с,, 4, полинома 


(1.6.1). С учетом (1.6.8) эти коэффициенты легко записываются через су: 
= (х) (аЛ) - № (буи +204}; 


| т | т! 0] = 6. 
Сд 2 (х) =36,; 4, Б тен 
к 


Программное обеспечение, с текстами которого, как и с другими программа- 
ми, обсуждаемыми в данной книге, можно ознакомиться в работе [14], состо- 
ит из двух процедур. Первая из них: 


ЅРІІМЕ (М, Х, Е, В, С, р) 

оформленная как процедура, решает систему уравнений относительно су. 
Здесь: 

О м — число точек; 


О хиЕ — векторы, элементами которых являются х; и /,; 


О в, с, р — векторы с коэффициентами В,, с,, 4, полиномов (1.6.1) — 


результаты работы ѕРІІМЕ. 
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Вторая программа: 
ЗЕМАМ 0 Е Ва 70) 


оформленная как функция, использует результаты работы зЗРЬТМЕ и вычисля- 
ет значение сплайна в заданной точке 0. 


1.7. Интерполяционный полином Эрмита 


Все предыдущие разделы этой главы относились к задаче интерполирования 
по значениям функции. Если в таблице помимо значений функции присутст- 
вуют ее производные и от интерполяционного полинома требуется совпаде- 
ние с данными этой таблицы, то такая задача называется интерполированием 
по Эрмиту. Познакомимся с ней на отдельных примерах. 


Для следующих исходных данных: 


требуется построить интерполяционный полином Н(х), удовлетворяющий 


всем условиям таблицы. Прежде чем это будет сделано, целесообразно отве- 
тить на некоторые вопросы. 


ВОПРОС 6 


Какой степени получится полином Эрмита? Как найти его коэффици- 
енты? Если по этим же трем узлам построить полином Лагранжа, ис- 
пользуя только значения /„, то какой из двух полиномов будет при- 


ближать функцию успешнее и почему? 
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Потребуем от Н(х) выполнения условий таблицы 


Я) =), О: 12. 
Н'(хр)= 6р) к= 0,1 (1.7.1) 
Н'(х) = О), К = 1. 


Система (1.7.1) содержит шесть уравнений. Для ее однозначного решения 
полином Н(х) должен иметь 6 коэффициентов, т. е. быть полиномом пятой 


степени. Общее правило очевидно: степень интерполяционного полинома 
Эрмита на единицу меньше общего числа условий таблицы. 


В задаче интерполирования по значениям функции уже возникала система 
(1.2.2), аналогичная системе (1.7.1). Тогда оказалось возможным построить, 
например, полином Лагранжа (1.3.3), не решая системы (1.2.2). Нельзя ли и в 
случае полинома Эрмита воспроизвести его сразу в готовом виде, не решая 
системы, подобной (1.7.1)? Ответ на этот вопрос положительный. Однако 
общая формула является громоздкой, и мы не будем ее приводить. При этом 
форма записи полинома будет проще, если исходная таблица симметричная, 
т.е. число и вид условий во всех узлах одинаковые (в отличие от системы 
(1.7.1)). Так, например, если в каждом узле ж, д, ..., х, заданы функция 


(ху) и ее производная /'(х;), то полином Эрмита имеет степень 2м +1 и 


описывается следующей формулой: 


т (х) 
Н = А 
ОР А жж 


(1.7.2) 
о"(ху) Г 
х Р(х): (хх, ) + (%)(х-х, } |, 
о (ху) } 
а его остаточный член отвечает выражению: 
(2т+2) 
КЎ (х) = Ты: ПЕ[а, 5]. (1.7.3) 


(2т-2)! 


В обеих формулах о(х) по-прежнему имеет вид (1.3.1). 
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В качестве еще одной иллюстрации обратимся к разложению функции /(х) 


в степенной ряд Тейлора в точке ху 


Ро) = (ху) +2 А Оо) + 
а Бай о) + 0) т) (1.7.4) 
= Н(х овса? У (п), 


Полином второй степени А, (х), с одной стороны, является частной суммой 
ряда Тейлора, а с другой стороны, удовлетворяет условиям 


Н›(ж)= (х0), Н, (хо) = (0), Н (хо) = Г"), 


что позволяет назвать его одновременно и интерполяционным полиномом 
Эрмита с одним узлом интерполирования. 


В заключение данного раздела зададим еще один вопрос, дополняющий во- 
просы З и 5. Надеемся, что на него читатели смогут ответить самостоятельно. 


ВОПРОС 7 


На промежутке [ж,х›| по трем узлам интерполирования ху, ху, х› 
построим интерполяционный полином Лагранжа второй степени 
О, (х), а затем построим полином Эрмита Н>(х), в соответствии с 


формулой (1.7.4). Оба полинома являются полиномами второй степени. 
Какой из них приближает исходную функцию /(х) лучше и почему? 


1.8. Обратная интерполяция 


До данного раздела решалась прямая задача интерполирования. По известной 
таблице: 
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и заданному значению х' требуется оценить значение функции Г (х). В об- 
ратной задаче для такой же таблицы требуется восстановить значение аргу- 
мента х’, для которого функция принимает заданное значение /”. На прак- 
тике чаще всего используется один из следующих очевидных способов. 

Способ 1. Меняются местами строки таблицы, в качестве узлов интерполи- 
рования выбираются значения /,, а в качестве значений функции х;, и 
строится интерполяционный полином для обратной функции. Подставляя в 
него Г”, находим желаемое х’. Такой подход вполне жизнеспособен, если 


существует обратная функция, т. е. исходная функция является строго моно- 
тонной. В противном случае необходимо делить таблицу на части с участка- 
ми строгой монотонности. 


Например, обратный квадратичный полином для фрагмента таблицы: 


Хоа) | Роа) | Ло) 


будет иметь вид: 


7 8) Е УЛ) Ла) 


Р Ле- Е 
(лал) (А-Л) (А-Л) 


(Ла - Л 


Способ 2. По исходной таблице строится обычный интерполяционный по- 


лином О,„(х) с узлами х, а затем решается уравнение О, (х) = г . Для по- 


линомов до четвертой степени ответ может быть получен даже аналитиче- 
ски, а в других случаях это уравнение решается численно, например, одним 
из методов решения нелинейных уравнений, рассматриваемых далее. Здесь 
нет необходимости принимать во внимание монотонность. Для немонотон- 
ной функции уравнение будет иметь несколько корней на промежутке ин- 
терполирования, и из них лишь нужно выбрать отвечающий поставленной 
задаче. 


2 Зак. 3418 
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1.9. Простейшие квадратурные формулы 


Квадратурные формулы — это формулы для вычисления значения опреде- 
ленного интеграла. Их получение — одно из многочисленных возможных 
приложений интерполяционных полиномов. Пусть требуется вычислить сле- 
дующий интеграл 


Б 
Г = | Ходак, (1.9.1) 


точное определение которого весьма затруднено или невозможно. Тогда ис- 
ходная функция может быть аппроксимирована интерполяционным полино- 
мом: 


<) = О„(х) + К, (х), 
И интеграл ОТ интерполяционного полинома порождает некоторую квадра- 
турную формулу 


Ь Ь 
Г = | Уодах = [О (х)ах, (1.9.2) 
а а 
а интеграл от остаточного члена полинома определяет ее погрешность 
Б 
== [А,„(х)ах. (1.9.3) 
а 


Будем последовательно подставлять в (1.9.2) полиномы различных степеней, 
начиная с нулевой (Оу(х) = / (хо) ). 
[= (Б-а) (хо). 


Наиболее популярными являются следующие три варианта выбора узла ху: 


хо =а, Г=(6-а)/ (а), (1.9.4) 

хо = Ё, Ге (Б-а)у(Ь), (1.9.5) 
р Б 

х= СЕЕ } (1.9.6) 


Формула (1.9.4) называется квадратурной формулой левых прямоугольников, 
(1.9.5) — формулой правых прямоугольников, (1.9.6) — формулой средних 
прямоугольников. Причины таких названий легко понять из геометрических 
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иллюстраций рис. 1.4, а—в, откуда видно, что площадь под заданной функ- 
цией аппроксимируется площадью соответствующего прямоугольника. 


“ 
< \ 


© 


а 
О е" 
ть Я 


Б 


РА 
/ 
р. 
/ 
А 
/ 
А 
и 
/ 


< М 
ч 
мау -Х 


9 


х, 


а 6 в г 


Рис. 1.4. Квадратурные формулы (1.9.4) — (1.9.7) 


Интегрирование полинома первой степени с узлами интерполирования 
хо =аих=Ь 


х-а 
= У() 


порождает квадратурную формулу трапеций (рис. 1.4, г) 


о0)= 222 у(а)+ 
а- Б 


р-а 
[= (Л@)+/6)), (1.9.7) 
с: а+Ь 
а интегрирование полинома второй степени с узлами ху = а, х = 7 


х) = Ь приводит к квадратурной формуле Симпсона: 


[= 


О (1.9.8) 
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Аналогичные формулы могут быть получены и для полиномов более высо- 
ких степеней. Прежде чем будут получены соответствующие выражения, 
проверьте свою интуицию и попытайтесь ответить на вопрос, руководствуясь 
формулами (1.9.6), (1.9.7) и соответствующими рисунками. 


ВОПРОС 8 


Многократно для самых различных функций считаются интегралы по 
формуле средних прямоугольников и по формуле трапеций. Для какой 
из них "в среднем" значение интеграла будет получаться точнее? 


Оценку погрешности квадратурных формул будем выполнять на основе двух 
известных в математике теорем о среднем. 


Теорема. Пусть /(х) и #(х) непрерывны на [а, Б], а р(х) в дополнение к 


этому знакопостоянна. Тогда найдется точка се [а, Ь] такая, что 


Б Б 
[е() Оо)ах = (с) [еодах. (1.9.9) 


Теорема. Пусть /(х) непрерывна на [а, 2], и заданы № точек х, Е [а,Б]. 


Найдется точка тє [а, 5 | такая, что 


У) = 0), (1.9.10) 


Остаточный член интерполяционного полинома нулевой степени имеет вид 


Х = Хү 
1! 


Ко(х) = (п). 


Полезно заметить, что точка т зависит от х, т. е. 1 = 1(х), как это уже отме- 


а+ 
чалось в конце разд. 1.3. Последовательно подставляя ху = а, 6 и ‚ ВЫ- 


числим интеграл (1.9.3). 


Формула левых прямоугольников: 


" | Е. (-а)? + 
Еле. пр. = [0 4) 7 (п)ах = ЛП | аах = 2—7 (1 ). (1.9.11) 


Аппроксимация функций и смежные вопросы 31 


Формула правых прямоугольников: 


(Ф- Ж 


а = о Б) '(т)ах = гете Бах = 0—0 (). (1.9.12) 


Формула средних прямоугольников: 


Ь 
а+Ь) 
8 средн. пр. = [=- у (т)ах. 


2 


В выражениях (1.9.11) и (1.9.12) была использована теорема о среднем 
(1.9.9), т. к. функции х-а и х-Ё являются знакопостоянными на [а, Ь]. 


Воспользоваться этой теоремой для средних прямоугольников не удается, 


а+Ь 
Т. К. ры меняет знак. Для оценки погрешности в этом случае вос- 


а 
пользуемся разложением Х(х) в ряд в точке 


а+ Б а+ђ 
а+ь\ “2. 2. а+ђ х 2 | 
ос 0658) 2825 Ты 
интегрируя его на [а, Б]. Интеграл от первого слагаемого дает формулу 


средних прямоугольников, интеграл от второго слагаемого равен нулю, а ин- 
теграл от последнего слагаемого дает оценку погрешности. Таким образом, 
для формулы средних прямоугольников имеем: 


іе а+ р е Е "(п )2 + р . 
вень 2 [= 5 пев 010 [98] ах = 


2 
А А (1.9.13) 


= нр у 


Использование теоремы о среднем в последнем случае уже вполне закономерно. 


Формулы (1.9.11) и (1.9.12) отличаются знаком. Возникает следующий вопрос. 


ВОПРОС 9 


Дважды вычисляем интеграл по формулам сначала левых, а затем пра- 
вых прямоугольников. Определяем полусумму результатов. Погрешно- 
сти сокращаются, и результат получается точным? 
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Для оценки погрешности формулы трапеций проинтегрируем остаточный 
член полинома первой степени 


Б 
трап г = о 13 0) т (п)ах = "(п о! [00-02 2220 
а Е (1.9.14) 
— а А 
7 Ге) 


Здесь также применена теорема о среднем. Наконец, для интеграла от оста- 
точного члена интерполяционного полинома второй степени 


оа 925) 


К(х) = 31 


и! 
Га) 
условия теоремы о среднем не выполняются, и погрешность формулы Симп- 
сона определяется по-другому. По этим же трем узлам строится полином Эр- 
мита уже третьей степени с двумя условиями в центральной точке, погреш- 
ность которого и интегрируется. Результат приведем без вывода. 


2-а) „4 
Симпс = 2880 ой (7 ). (1.9.15) 


В большинстве случаев подынтегральная функция не описывается удовле- 
творительно полиномами первой или второй степени. Поэтому для достиже- 
ния необходимой точности исходный промежуток разбивается на такие ма- 
лые промежутки, где указанная аппроксимация удачна, на каждом из этих 
промежутков применяется выбранная квадратурная формула, а результаты 
складываются. Такие формулы получили название составных (или больших) 
квадратурных формул. 


1.9.1. Составные квадратурные формулы 


Разобьем исходный промежуток на № равных промежутков [х,,х,,|] 


р-а 
М 


Ре 


5 ху = хо + КЙ, Хо = а, Ху = Ё. 
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На каждом таком промежутке применим формулу левых прямоугольников и 
результаты сложим: 


Хе] 


= { Го р х) ЈО) = ао, ; 
М] Ь —_а М№М-—1 
Г лев пр. — Ў 1 = № ЕД9 (1.9.16) 
к=0 к=0 


Аналогичные преобразования для формул правых и средних прямоугольни- 
ков, а также для формулы трапеций приводят к следующим результатам: 


С правые прямоугольники: 


Г, = ПР одак ао) уц) 


7 


М-1 М 
[ прав. пр. = 2, 1, З (1.9.17) 
О средние прямоугольники: 
Хед –а 
= | Года = (хрх) О + А12) = г Р(х + А12), 
х 
№1 р 
1 средн. пр. = Уд 65У Лич) 

(1.9.18) 


а 85 а) 


№ 0 
С трапеции: 


Хк] 


= | РО)ахғ А ло) од) = (Окы) + би); 


Хх 


М1 рамы 
Гоа = 2. = У (Хоа) + Лох) = 
к=0 2№ к=0 
(1.9.19) 
= 7 о) +25 оа) л) 
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Формулы (1.9.16)—{(1.9.19) называются составными квадратурными форму- 
лами левых, правых, средних прямоугольников и трапеций соответственно. 
Для получения составной формулы Симпсона будем выбирать № всегда чет- 
ным, а исходный промежуток разобьем на М№/2 равных промежутков 


[х,,х;,2] длиной 2(Ь-а)/ №. На каждом из них интеграл равен 


0; Лодах = ся К (Уж, 2) + 4 (жи) + Лох) = 


ина 


Суммируя по всем промежуткам, получаем составную формулу Симпсона: 
р-а 
5 в 7 
Симпс м (1.9.20) 
х| (а) +4(7 кА А+.) +205 + +. о) 1) |. 


1.9.2. Погрешности составных формул 


Для оценки погрешности составных формул вычисляем погрешность каждо- 
го малого участка и результаты складываем. Так, для формулы левых прямо- 
угольников на основе (1.9.11), применяя дискретный вариант теоремы о 
среднем (1.9.10) к выражению в квадратных скобках, имеем: 


быа у) 69 а) р) 


< Ф-а) 
лев. пр. = 2, ер = 2№ ўе ГЕ Фа) т) (1.9.21) 


Повторяя аналогичные вычисления с формулой (1.9.12) для правых прямо- 
угольников получаем: 


шв пр. = -5- й и о (1.9.22) 
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Выражение (1.9.13) позволяет получить составную формулу средних прямо- 
угольников: 


Ы р п р – МА 
ааа 0 1 ЈЕ а а 0)! (1.9.23) 


а выражение (1.9.14) — аналогичную формулу трапеций: 


3 
+1 — " р : т 
9 2 бкн 3), Се саси (п), 


12 2л) 
М Ф-аў __ (6-а)’ и 
етра = 5266 = ТТР л 2+ 2—7 "00). (1.9.24) 


Теперь сравнение формул (1.9.23) и (1.9.24) позволяет вернуться к вопросу 8. 


При использовании выражения (1.9.15) для оценки погрешности составной 
формулы Симпсона следует учитывать, что длина каждого малого участка в 
два раза больше, чем ранее, а число таких участков в два раза меньше — 
№/2. 


5 
__ (хых) ро РЕ 0 7% (п), 


он = 
А 2880 90м 
№/2 (Б-а) 1 №2 (4) 
Е = Су == == == 
трап 2. К 180%“ Раж (ти) 
(1.9.25) 
__ (6-а) да) 
180%“ 180“ 0) 


При сравнении формул (1.9.21)—(1.9.25) наибольший интерес вызывает за- 
висимость погрешности от №, позволяющая оценить дополнительный объем 
вычислений, связанный с увеличением № для уменьшения погрешности до 
требуемой величины. Нетрудно также заметить, что все эти формулы описы- 
ваются общей зависимостью 


6029) _ а)” 


(р) 1.9.26 
УВ Фа)?" (1), ( ) 
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где © — некоторое число. Так для формул левых и правых прямоугольников 
р =Ъ для средних прямоугольников и трапеций р = 2, а для формулы Симп- 


сона р=4. 


Следует заметить, что все квадратурные формулы были получены в предпо- 
ложении, что пределы интегрирования конечны, а подынтегральная функция 
не имеет особенностей. При вычислении значений несобственных интегралов 
обычно предварительно с помощью специальных приемов интеграл приво- 
дится к специальному виду, позволяющему сочетать использование квадра- 
турной формулы и некоторого аналитического приема. При этом успех часто 
определяется квалификацией пользователя и его умением учесть специфику 
решаемой задачи. 


В заключение данного раздела остановимся на том, как погрешность квадра- 
турных формул оценивается на практике. Целесообразно назвать следующие 
способы. 


Способ 1. Непосредственная оценка погрешности по формуле (1.9.26) при- 
меняется крайне редко из-за известных трудностей, связанных с оценкой 
производной, особенно для табличной функции, а также из-за отсутствия ин- 
формации о расположении точки т. 


Способ 2. Сравнение результатов, полученных по выбранной составной 
квадратурной формуле для № и 2№. В случае неудовлетворительного совпа- 
дения значение № удваивается до тех пор, пока требуемая точность не будет 
достигнута. 


Способ 3. Если по каким-либо причинам есть ограничение на рост величины 
№ и способ 2 применен быть не может, сравнивают результаты для одного и 
того же значения №, но для различных квадратурных формул. 


Способ 2 наиболее популярен, и построенная на его основе упрощенная вер- 
сия алгоритма легко укладывается в несколько элементарных шагов: 


І. Задаемся начальным значением № и вычисляем интеграл по любой со- 


ставной квадратурной формуле, присваивая результат переменной Гоц. 


2. Удваиваем величину № и вновь вычисляем интеграл, присваивая резуль- 
тат переменной /леу: 


3. Если значения Гоц и Гы совпали с заданной точностью, то прекращаем 
работу. В противном случае присваиваем переменной Га значение Г. 
и возвращаемся к шагу 2. 
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Несмотря на весьма простой вид, этот алгоритм позволяет достичь требуемой 
точности при вычислении интеграла от любой "разумной" функции, не 
имеющей особенностей на промежутке интегрирования. Более того, надеж- 
ность написанной на его основе программы вполне сравнима с надежностью 
программного обеспечения, обсуждаемого в разд. 1.11. 


1.10. Общий подход к построению 
квадратурных формул. Метод 
неопределенных коэффициентов 


Все полученные ранее простейшие квадратурные формулы (не составные) 
имеют следующий вид: 


Б $ 
[одах = Уу А ГО). (1.10.1) 
а к=] 


Узлы х, и веса А, квадратурной формулы в предыдущем разделе получались на 
основе интегрирования соответствующих интерполяционных полиномов. Поста- 
вим задачу несколько иначе. Требуется выбрать х, и А, так, чтобы формула 
(1.10.1) была точной для полиномов заданной степени. Логика таких требований 
очевидна. Если подынтегральная функция хорошо аппроксимируется этим поли- 
номом (не обязательно интерполяционным), то и формула (1.10.1) обеспечит 
требуемую погрешность решения задачи. В противном случае промежуток 
[а, Ь] всегда можно разбить на достаточно малые промежутки, применить со- 


ставные квадратурные формулы и добиться желаемой точности. 


Потребуем, чтобы формула (1.10.1) была точна для полинома нулевой степе- 
ни (х) = а =соп$. Вынося константу © из-под знаков интеграла и суммы и 


сокращая на нее, имеем: 
5 
уз А, = Б С, 
к=] 


Второе уравнение получим, требуя точности (1.10.1) для полинома первой 
степени и подставляя с этой целью /(х) = х: 
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2 


Это же требование для /(х)=х” выглядит следующим образом: 


5 з 3 
Ў А. 5-а 
КС] 3 


р 


а в общем случае для (х) = х“ условие с номером № +1 приобретает вид: 
Ь\+і М+1 


5 22 
= 
2. й №М+1 


Объединяя все уравнения, получим следующую систему в общем случае не- 
линейных уравнений: 


5 
] У 4, =Ё-а, 
Г 
5 250 
2; РА Е А 
Ет 2 
5 323 1.10.2 
ое в 
рии 3 
< рМ _ ом 
М, А, х^ = 
2, и М +1 


относительно 25 неизвестных х; и 4, . В связи с нелинейностью возникает 
целый ряд вопросов, требующих разрешения. Существует ли решение? 
Единственно ли оно? Получаются ли х, в этом случае не только вещест- 


венными и различными, но и лежащими на [а, Ь] ? 


Система (1.10.2) является общей для многих семейств квадратурных формул, 
отличающихся друг от друга дополнительными условиями, накладываемыми 
на х; и 4, . Рассмотрим три таких семейства. 


1.10.1. Квадратурные формулы Ньютона — Котеса 


Узлы квадратурной формулы х, здесь выбираются равноотстоящими 
р -а 
$ – 1 


й = 5 х, =а+(К – 1)р, х =а, хс = Ё. 
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Система (1.10.2) в данном случае является линейной относительно © неиз- 
вестных 4, и легко разрешима. Ее определитель является определителем 
Вандермонда (1.2.3), что обеспечивает единственность решения. Кроме того, 
равноотстоящие узлы дают некоторые удобства при программировании этих 
формул. Но не эти моменты являются решающими. Для составных квадра- 
турных формул при удвоении М (числа внутренних промежутков) в половине 
возникающих узлов х, значения функций /(х,) уже вычислялись ранее и 


могли быть сохранены, что позволяет сократить объем вычислений вдвое. 


Как результат, имеем систему (1.10.2) из 5 уравнений с 5 неизвестными 
А,, и эти квадратурные формулы оказываются гарантированно точными 
для полиномов степени № = 5 – 1. Нетрудно заметить, что, решая систему 
последовательно для 5 = 1,2 и3, приходим к уже хорошо знакомым фор- 


мулам прямоугольников, трапеций и Симпсона, получавшимся ранее дру- 
гим способом. 


1.10.2. Квадратурные формулы Чебышева 


Для целого ряда приложений, особенно когда значения (х, ) определены с 


заметной погрешностью, П. Л. Чебышевым были предложены квадратурные 
формулы с равными весами ( 4, = А = сопѕї ): 


Ь 5 
[Года = АУ, РО). (1.10.3) 
а Ке] 


Система (1.10.2) оказывается системой из 5+ [ уравнения относительно тако- 
го же числа неизвестных ху и А, что позволяет в случае успешного решения 


получить формулы, гарантированно точные для полиномов степени № = $. 
Однако, учитывая нелинейность системы, вопросы существования и единст- 
венности решения выходят на первый план. Оказывается, что система 
(1.10.2) благополучно решается единственным образом для 5 от 1 до 7 и для 
$ =9. С. Н. Бернштейном было показано, что для других значений 5 формулы 
Чебышева не существуют. Для практических целей это не является серьез- 
ным препятствием, т. к. необходимая точность обеспечивается использовани- 
ем составных квадратурных формул. 
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1.10.3. Квадратурные формулы Гаусса 


В этих формулах на узлы и веса не накладываются никакие дополнительные 
условия, и все свободные 25 параметров используются при решении систе- 
мы (1.10.2) из 25 уравнений. В отличие от формул Чебышева формулы Га- 
усса существуют для любого числа узлов. Они гарантированно точны для 
полиномов степени № = 25 –1 и называются формулами наивысшей алгеб- 
раической степени точности. Далее будет показано, что узлы х, являются 


нулями так называемых ортогональных полиномов Лежандра. 


Пример. В качестве иллюстрации построим формулу Гаусса с двумя узлами 
(т.е. 5 = 2 ) на промежутке [-1, 1. Система (1.10.2) задает следующие четы- 


ре уравнения: 


А+А,=2, Аж+Арх, =0, Ад + А =, Ах + А3 =0. 


2 
Умножая второе уравнение на ху и вычитая результат из четвертого, имеем: 
2 2р 
Ах) (25 — Хү }=0 ь 
Легко убедиться в том, что 24, + 0, х, +0, х, # ху, и в качестве решения на 
основе первого и третьего уравнений имеем: 
| е 
р. 
УЗ 
Эта формула точна для полинома третьей степени (М=25-1=3), и, хотя 
этот факт нами строго доказан, геометрическая иллюстрация достаточно впе- 


ж=-х = А=А, =1. 


чатляющая. График полинома третьей степени на промежутке [-1, 1] может 


быть весьма разнообразным. Полином может иметь здесь как один, так и три 
нуля, или вообще быть знакопостоянным. Как результат, строим график иро- 
извольного полинома третьей степени, вычисляем два его значения в точках 


+1/4/3 ‚ складываем результаты, и значение интеграла от полинома (т. е. 


площадь под ним) на промежутке [-1, |] ... оказывается абсолютно точным! 


В заключение заметим, что на практике для получения 4, и х, нет никакой 
необходимости каждый раз обращаться к системе (1.10.2). Результаты ее ре- 
шения для стандартного промежутка [--1, 1] или [0, 1] и для каждого кон- 


кретного семейства формул приведены в многочисленных справочниках и 
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учебниках. Пользователь лишь ограничивается заменой переменных в 
(1.10.1). Так для промежутка [-1, 1] такая замена переменных выглядит сле- 


а+Ьь Б-а 
+ 


дующим образом: х = і. При изменении Е от –~1 до 1 переменная 


Б-а 
х пробегает значения от а до Ь. С учетом того, что Е формула 


(1.10.1) имеет вид: 


(1.10.4) 


где веса А, и узлы [ квадратурной формулы берутся из справочника для 
[-Ь 1. 


Рассмотренные семейства квадратурных формул не исчерпывают всех воз- 
можностей формулы (1.10.1). Как уже отмечалось, другие семейства отлича- 
ются выбором дополнительных требований к 4 и ху. 


1.11. Адаптивные квадратурные формулы. 
Программа СОЦЧАМСВ8 


Простой алгоритм вычисления интеграла на основе составных квадратурных 
формул, приведенный в конце разд. 1.9, отличается достаточной надежно- 
стью, но его быстродействие может быть заметно повышено. Например, для 
функции, представленной на рис. 1.5, на участке с быстрым изменением 
функции требуется относительно малый шаг. В то же время, т. к. в составной 
формуле шаг постоянен для всего промежутка, то общий объем вычислений 
будет неоправданно велик. 


Целесообразным представляется построение алгоритма, который был бы 
способен адаптироваться к виду функции и выбирать достаточно малый 
шаг там, где функция меняется быстро и характеризуется большими произ- 
водными, и относительно большой шаг там, где функция меняется медленно. 
На этом пути возможны два варианта: минимизировать погрешность при за- 
данном объеме вычислений или минимизировать объем вычислений при за- 
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данных требованиях к погрешности. В рассматриваемой программе реализо- 
ван второй подход. 


7 (х) 


х 


Рис. 1.5. Пример функции с различным поведением 


В основу положена квадратурная формула Ньютона — Котеса с девятью уз- 
лами, т.е. восемью промежутками между ними, что и оправдывает название 
программы. Ее составная формула имеет погрешность вида (1.9.26) для 


р=10. Рассмотрим промежуток длиной А, внутри [а, Д и введем для него 


следующие обозначения: 


О Г — точное значение интеграла на этом промежутке; 


П БВ — значение интеграла, вычисленное по квадратурной формуле с девя- 
тью узлами; 


О О, — значение интеграла, вычисленное по той же формуле, применен- 


ной к двум половинам этого промежутка (по сути используется составная 
формула с вдвое большим значением М ). 


Учитывая вид (1.9.26) для р=10, для погрешностей Р, и О, последователь- 
но имеем: 


2 Әр. _ О-В _ О-В 
а. ЕО 


1-Р ‚=2?Р( 1, – б: 
корт” (0-01): п 2Р-1 1023 
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Обозначая требуемую абсолютную погрешность вычисления интеграла на 


всем промежутке [а, Ь] за ғ 4, считаем промежуток А, "принятым", а инте- 
грал на нем вычисленным, если выполняется неравенство 


О, = Б Р й 


Е (1.11.1) 


А 
= 


Множитель является весовым коэффициентом и отражает вклад по- 


грешности на промежутке р, В общую погрешность для всего промежутка. 


Возможно также использование и относительной погрешности ёр 


О, = В с № 
1023 | Б-а 


ЕР А, , (1.11.2) 
где Г, — оценка вычисления интеграла по всему промежутку. Следует, од- 
нако, помнить, что использование критерия относительной погрешности ус- 
ложняется, если значение 1, оказывается нулевым или близким к нулю. 


В программе оолмсв пользователю предоставляется возможность выбирать 
один из трех вариантов контроля погрешности на основе объединения фор- 
мул (1.11.1) и (1.11.2): 

йк 


а 5 = пах(е, ; Єр А). (1.11.3) 


С Вариант 1: єр = 0, =, #0 — контроль абсолютной погрешности. 
С Вариант 2: =», #0, =, = 0 — контроль относительной погрешности. 
С Вариант 3: єр = 0, =, + 0 — контроль "смешанной" погрешности. 


В последнем случае делается попытка избежать упомянутых неприятных си- 


туаций со значениями 7, , близкими к нулю. 


Адаптация программы к виду функции и реализация переменного шага ин- 
тегрирования реализуются в соответствии со следующим алгоритмом. Вы- 
числяются Р, и О, применительно ко всему промежутку. Если погрешность 


еще достаточно велика, промежуток делится пополам, значения подынте- 
гральной функции /(х), вычисленные на правой половине промежутка, за- 
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поминаются, и все повторяется для левой половины промежутка. Такое об- 
ращение каждый раз к левой половине текущего промежутка продолжается 
до тех пор, пока крайний слева промежуток не будет принят. После этого 
обрабатывается ближайший к нему правый промежуток. Запоминание 
значений /(х) повышает быстродействие алгоритма. Как уже отмечалось в 
предыдущем разделе, для составных квадратурных. формул Ньютона — 
Котеса при удвоении № (числа внутренних промежутков) в половине 
возникающих узлов х, значения функций /(х;) уже вычислялись ранее и 


могли быть сохранены, что позволяет сократить объем вычислений вдвое. 

В программе реализовано два ограничения сверху на объем вычислений. Во- 
первых, деление промежутка пополам продолжается не более 30 раз. По дос- 
тижении этой величины соответствующий интеграл на нем считается вычис- 
ленным, а промежуток "принятым", независимо от условия (1.11.3). Число 
таких промежутков, принятых с нарушением условия (1.11.3), содержится в 
целой части выходного значения переменной ЕТАС. Следует признать, что 


длина каждого такого промежутка крайне мала (2-а)/2?% 510° (р-а) ‚и 


подобная ситуация, как правило, связана с разрывами подынтегральной 
функции или ее "зашумлением" вычислительной погрешностью. Во-вторых, 
вводится ограничение сверху на количество вычислений подынтегральной 


* 
функции (х). Если этот предел достигнут, то информация о точке х , где 
возникла трудность, отражена в дробной части выходного значения перемен- 


НОЙ ЕТАС (там записана величина ( р" ТС -а)). 


В [14] приводится пример использования программы для вычисления инте- 
грала 


2 
1= 89 а, 
0 


ООАМС8 выдает значение переменной ЕЪАс равное 91.21, что не только обра- 
щает внимание на 91 промежуток, принятый с нарушением условия (1.11.3), 


но и указывает на точку х’, где встретились затруднения. Определив х’, 
(6-х )/Дь-а) =0.21; х'=5-0.2-а)=1.58, 


пользователь вынужден обратить внимание на неинтегрируемую особенность 
в точке х=л/2 =1.57. 
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Программа имеет следующие параметры 


ОЦАМС8 (ЕОМ, А, В, АВЗЕВВ, ВЕЬЕВВ, КЕЅ0О1Т, ЕККЕЅТ, МОГОМ, ЕТАС) 


где. 


О 


гм — имя подпрограммы-функции, вычисляющей значение 
подынтегральной функции / (х); 


А, В — нижний и верхний пределы интегрирования; 


АВЗЕВВ И ВЕТЕВВ — границы абсолютной є, и относительной єр по- 


грешностей. 


Остальные параметры — выходные со следующим смыслом. 


О 
О 


ВЕЗОШТ — значение интеграла, определенное программой; 


ЕВВЕЗТ — оценка погрешности, выполненная программой и удовлетво- 
ряющая (1.11.3); 


моғум — количество вычислений подынтегральной функции Х(х), ис- 
пользованных для получения результата; 

ЕТАС — индикатор надежности результата. Нулевое значение этой пере- 
менной отвечает относительной надежности результата, а ненулевое, как 


уже отмечалось, свидетельствует об отклонениях от нормального хода 
выполнения программы. 


В заключение раздела два вопроса. 


ВОПРОС 10 


Предложенная программа О0АМС8 построена на основе формулы Нью- 
тона — Котеса с девятью узлами. Возможно ли построение аналогич- 
ной адаптивной программы на основе формулы Симпсона? Если "нет", 
то почему? Если "да", то в каких частях программы произойдут изме- 
нения? 


ВОПРОС 11 


Та же группа вопросов, но уже применительно к формуле Гаусса, на- 
пример, с девятью узлами. 
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1.12. Численное дифференцирование 


Предлагаемая задача ставится следующим образом. Для таблично заданной 


функции: 
ям ||. 
пао |тоо |тоо ты 


требуется оценить значения производной функции (х) в узлах таблицы. 


Книга известного американского ученого Р. В. Хемминга "Численные методы" 
[15] начинается с весьма полезного совета читателю: "Прежде чем решать за- 
дачу, подумай, что делать с ее решением". Последуем этой рекомендации. 


70а), в) ие 


Рис. 1.6. Функция /(х) и ее "зашумленный" вариант 


Пусть для функции /(х) выбрана аппроксимирующая функция 2(х), которая 
признана достаточно близкой к исходной по какому-либо заданному критерию, 
например, по максимуму модуля отклонения (1.1.1). Будут ли близки интегра- 
лы от этих функций? Положительный ответ на этот вопрос очевиден. А будут 
ли близки их производные? На рис. 1.6 отражен вид двух функций: / (х) и ее 
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"зашумленного" варианта &(х). Сами функции и интегралы от них (т. е. пло- 
щади под обеими кривыми) весьма близки, в то время как производные совпа- 
дают только в нескольких точках, а часто отличаются даже по знаку! 


Еще более убедительным является следующий пример. Рассмотрим две 
функции /(х) и #(х) и их производные: 


г. 
Лод; 80) = ХО) +еіп( 2х); 


о). аво) 0) 
4х ’ ах ах 
С ростом величины № обе функции становятся по отношению друг к другу 


все ближе и ближе, а их производные... все дальше и дальше! Таким образом, 
близость /(х) и &(х) еще не гарантирует близости их производных. 


+ М№соѕ( №2х). 


Для того чтобы повысить уверенность в надежном решении задачи числен- 
ного дифференцирования, на практике делают целый ряд предположений о 
характере дифференцируемой функции. Шаг таблицы должен быть не слиш- 
ком велик и согласован с быстротой изменения функции. Сама функция не 
должна быть измерена со слишком большими погрешностями (т. е. быть 
"зашумленной"), не должна слишком резко изменяться и т. п. Примеры 
функций, подобных 2(х) на рис. 1.6, должны быть исключены. Таким обра- 


зом, численное дифференцирование должно выполняться с максимальной 
осторожностью и сопровождаться предварительным анализом характера из- 
менения функции и погрешности исходных данных. В силу указанных при- 
чин с повышением порядка получаемой производной значительно возрастает 
риск получения отрицательного результата. 


Идея, лежащая в основе численного дифференцирования, крайне проста и уже 
использовалась при получении квадратурных формул (см. (1.9.2) и (1.9.3)). Ис- 
ходная функция аппроксимируется интерполяционным полиномом 


(х) = 0„(х) + А,„ (х), 
и производная от полинома дает формулу численного дифференцирования 


аго) 404) 
ах ах ’ 


а производная от остаточного члена позволяет оценить погрешность этой 
операции 


т 


ах 


ак) 
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Ограничимся случаем, когда узлы таблицы — равноотстоящие с шагом 
й=х,.| ху. Начнем с полинома первой степени, построенного по двум уз- 


лам ХЕ И Хр: 


ХХ 


О И) - Окы) 


х Хд х 


Дифференцируя его и полагая последовательно х = ху и х = хуу, получаем: 


а) (х1) _ аа Л. 


Р у (1.12.1) 
ЧО) Жн Аы Лк 
Е ; (1.12.2) 


Хотя правые части обоих выражений равны, формулы получились принци- 
пиально различными. Выполним аналогичные операции для полинома вто- 
рой степени: 


(= Хк+1 (х ~ Хх +2) Р(х р) + (х — № Хх 2 Хк+2) 
(хр — хи (Хх Хо) (хур Хе (Хинт Хә) 


ем), 


(х2 — ^^ (х,у — Ху +2) 


Ох) = Л) + 


Последовательно полагая х = хџ, х= хуу и х= ху, получаем: 


а (х) 3) + АЛ — Јо 


1.12.3 

ах 21 | | 
а(н) Лао Је Ја 

1.12.4 

ах 2р ( ( 

Чиа) Зао АЈ + Л (1.12.5) 

ах 2А | Е 


Для оценки погрешности всех формул необходимо продифференцировать 
остаточный член А, (х). Для полинома первой степени он имеет вид: 


во) = А н) 
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Уместно напомнить, что в конце разд. [.3 отмечалась зависимость величины 
п от точки х, где оценивается погрешность, т. е. 1 = 1(х), и этот факт нужно 


учитывать при дифференцировании: 


т у УН) дит 
х 2! 21 


Спасает ситуацию то, что погрешность нужно оценивать в узлах интерполи- 
рования. Так при х= х; и х= х,у два слагаемых из трех в этой формуле об- 


ращаются в нуль: 


(х) = А == уч), (1.12.6) 
АЕ р 
Е (х) = а з а) (1.12.7) 


Выражения (1.12.6) и (1.12.7) задают погрешность численного дифференци- 
рования для формул (1.12.1) и (1.12.2) соответственно. Аналогично продиф- 
ференцируем погрешность А, (х): 


Бо) (х= х; )(х- чара х2) т), 


последовательно подставляя в результат х= х, х= х;у их= х, 


АЕ а 
ва) = 82 = уч) (1.12.8) 
АЕ А 
ва) = 1) = 7 у") (1.12.9) 
2 (Хк+2) = ЕЕЕ Е —/"(м) (1.12.10) 


и определяя, таким образом, погрешность численного дифференцирования 
для формул (1.12.3 )—(1.12.5) соответственно. Легко заметить, что на мень- 
шую погрешность можно рассчитывать, используя формулу (1.12.4), которая 
и является наиболее популярной на практике. Формулы же (1.12.3) и (1.12.5) 
используются для дифференцирования в начале и в конце таблицы соответ- 
ственно. 
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Если интерполяционный полином второй степени продифференцировать 
дважды, то получается простейшая формула для второй производной: 


2 
а Л) Лә 2+ (1 12.11) 
2 ый 2 . А . 
ах й 
Предложенный подход можно было бы развивать и дальше, привлекая новые 


узлы интерполирования и дифференцируя полиномы более высоких степе- 
ней, но мы ограничимся рассмотренными формулами. 


Практически важным является вопрос о выборе шага Йй для формул числен- 
ного дифференцирования. Ограничение сверху накладывается величиной по- 
грешности (1.12.6)—(1.12.10), а снизу — точностью задания табличных дан- 
ных для / (х), что, в свою очередь, определяется, например, результатами 


эксперимента или ошибками округления (разрядной сеткой компьютера). 


1.12.1. Влияние погрешности задания функции 
на точность 


В качестве примера вновь обратимся к простейшей формуле для первой про- 
изводной (1.12.1). Пусть в ней значение /,,у определено с погрешностью 
Л, у, а значение /, — с погрешностью ДА’. Тогда общая погрешность &(й) 


складывается из двух погрешностей 
(А) = Е (Й) +=>(#), 


первая из которых (л) задается формулой (1.1.6) и примерно линейно убы- 
вает с уменьшением шага й, а вторая зависит от Д, и Д, |. Оценивая пол- 
ную погрешность сверху, получаем 


(А) < |8,02) + =2(#)|= п Ст) + Аан А (1.12.12) 

2 ћ 
Налицо две противоречивые тенденции: с уменьшением й роль первого сла- 
гаемого, определяемого погрешностью формулы дифференцирования, 
уменьшается, а роль второго слагаемого возрастает. Таким образом, недопус- 
тимо использование как слишком большого шага й, так и слишком малого. 


Оптимальное значение шага Я» отвечает ситуации, когда оба слагаемых 


равны друг другу. Все сказанное и отражает, на первый взгляд, парадоксаль- 
ный рис. 1.7 оценки сверху для =(Й). 
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Рис. 1.7. Оценка погрешности (1.12.12) 


На практике в точном определении нет необходимости, важно лишь знать о 
характере зависимости (1.12.12). В заключение напомним, что величины Ах, 


А, у и их вклад в общую погрешность численного дифференцирования мо- 


гут быть как относительно малы, если определяются разрядной сеткой ком- 
пьютера, так и весьма велики, если являются следствием погрешности изме- 
рения экспериментальных данных. 


1.13. Среднеквадратичная аппроксимация 
функций. Постановка задачи 


Критерий интерполирования, предполагающий совпадение исходной и ап- 
проксимирующей функций в узлах таблицы, не является единственным. Об- 
ратимся к экспериментальным данным, представленным на рис. 1.8, а. Если 
выполнить по ним интерполяцию, то получится кривая на рис. 1.8, 6. Мало- 
вероятно, чтобы ее вид отвечал исходной зависимости, положенной в основу 
таблицы. Вероятнее всего, что этой зависимости отвечает кривая, похожая на 
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рис. 1.8, в, а отклонение экспериментальных данных от нее продиктовано 
сравнительно большой погрешностью измерений. В таком случае целесооб- 
разно использовать среднеквадратичный критерий (1.1.3) или (1.1.2), если 
аппроксимируемая функция задана на [а, | непрерывно. 


<) (х) (х) 


а б в 


Рис. 1.8. Аппроксимация экспериментальных данных 


Для более лаконичной формы записи последующих формул удобно ввести 
скалярное произведение (/, 2) для двух множеств функций (подробнее см. 


приложение 2). 


1. Множество непрерывных вещественных функций на промежутке [а, | 
образуют линейное пространство, которое при введении в нем скалярного 

Ь 
произведения (#, &) = | Р(х)е(х)ах определяет расстояние между элемен- 

а 


тами следующим образом: 


Б 
(7, в) |7 |= 407 е) = [О 0) ах. 
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Скалярное произведение может вводиться и в более общей форме, а 
именно 


р 
(7,8) = [рога ()ах, 


где р(х) > 0 — весовая функция. 


2. Множество функций, заданных на дискретном множестве точек: хү, 


х), ..., Ху, образуют линейное пространство со скалярным произведением 
М 
(7,2) = У (х) (х). 
=] 


Расстояние между элементами такого пространства имеет вид: 


М 
07,2) |7 - |= 07-67 - = [ое воо)? 


И здесь скалярное произведение можно вводить с весовыми коэффициен- 
тами р(х,): 


№ 
(7,8) = р(х) РО) (х). 
і=] 


Задача среднеквадратичной аппроксимации функции (х) для любого из 


этих двух множеств ставится следующим образом. Требуется подобрать та- 
кую аппроксимирующую функцию О(х), чтобы квадрат расстояния между 
О(х) и Г(х) был бы минимальным: 


р? = [06% - О =(О0) ГО), 969) - 109) тіп, 
Напомним, что, как уже обсуждалось в разд. І.І, близость функций по сред- 
неквадратичному критерию (1.1.2) еще не гарантирует малой величины их 
максимальной разности (1.1.1). Малое значение интеграла или суммы для р 
свидетельствует лишь о том, что почти на всем отрезке [а, 5] значения /(х) 
и О(х) мало отличаются друг от друга, хотя в отдельных точках или на не- 
больших отрезках разность их значений может быть значительной. 


В качестве иллюстрации рассмотрим функцию (х), график которой имеет 


узкий зубец высоты й с основанием ул? и функцию О(х) = 0 (рис. 1.9). 
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РЕ: 
Рис. 1.9. Пример функции с малой величиной р? 


Нетрудно вычислить: 


07,0) = -00]|= 407-0, 7-0) = 


го №] 
= Ју (х)ах < ЕТ. 


За счет выбора Й среднеквадратичное расстояние р(/,О) можно сделать 


Б 
[о Об) ах = 


сколь угодно малым, а величину тах |/ – О = й сколь угодно большой. 
а, № 


Проблема выбора аппроксимирующей функции решается так же, как и при 
интерполяции: О(х) выбирается в виде обобщенного многочлена (1.2.1) 


О (х) = а0фо(х) + ф(х) +...+а,„,ф,„(х) = У Ф, (х), (1.13.1) 
к=0 


где Ф "| — заданный набор линейно независимых функций, а коэффициенты 


а, подлежат определению. 
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1.13.1. Дискретный случай. 
Весовые коэффициенты 


Функция /(х) задается на дискретном множестве точек следующей таблицей: 


ЕЕ Н>. 
пае л | [ее 


а ее аппроксимация О, (х) выбирается в виде обобщенного многочлена 


(1.13.1). Коэффициенты а; выбираются из условия минимума величины р 


№ 
р2=(О(х) – 0), 90%) - 109) = (00) Л) > тт. (1.132) 


і=] 
Рассмотрим три варианта соотношений чисел № и т. 


О М№=т+1. Число коэффициентов а, равно числу точек таблицы, реше- 
ние задачи единственное, и им является интерполяционный полином, 
проходящий через все точки. Минимальное значение р? оказывается ну- 


левым. 


2 
О М<т+1. Минимальное значение р“ также равно нулю, но задача имеет 


бесконечное множество решений. 


О Л№>т+1!. Это типичный случай среднеквадратичной аппроксимации. 
Более того, на практике часто М№ >» т+1. Минимальное значение р? ока- 


зывается уже, как правило, ненулевым, а задача имеет единственное ре- 
шение. В данном разделе ограничимся этим третьим вариантом, т. к. пер- 
вый был уже рассмотрен, а ко второму вернемся в главе б. 


Записываем необходимое условие экстремума: 


2 
ОВ ЕС он 
да, 


и выполняем операцию дифференцирования: 
00 00 


ое ол 1+|0-7,20 |2 


да, р да, да, да, да 


(0- 7,0-7) = о- ў |=0. 


і 
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Подставляя в получившуюся формулу выражение для О, (х), получаем сис- 


тему линейных алгебраических уравнений относительно а; : 


(Фо, Фх )ао + (Фу,Фу)а +... + (Ф,„,Ф;)а, =(Ё,Фь), К=О,1,..., т. (1.13.3) 


Линейная независимость системы базисных функций ф(х) на заданном 


множестве точек обеспечивает ненулевой определитель системы 


(Фо Фо) ($1,0) -.. (Фи,Фо) 


(Фо) (ФФ) = (ФФ)! (1.13.4) 


(Фо,Фи„) (Ф.Ф) -.. (Ф.Ф) 
и задача имеет единственное решение. Самой популярной является аппрок- 


симация полиномами, когда ф(х) = х^ ‚ а система (1.13.3) приобретает вид 


М М М М 
авч Ух [а +...+ Уа |а [6 5 
і=] і=] і=] = 


а 


1=1 1=1 


м т+і Ы 
2. Хх; Чт = ›з Р(х, )х, ) 
1—1 (1.13.5) 


і=і 


М М М М 
а ао е а Е? Уло" |а, = ари) 
2 


На практике с ростом т определитель системы быстро уменьшается, а мат- 


рица становится илохо обусловленной (подробнее об этом явлении см. в гла- 
ве 2). 


При выполнении среднеквадратичной аппроксимации (другое название — 
"метод наименьших квадратов") возможна ситуация, когда исходные данные 
имеют различную точность. Если к каким-либо экспериментальным значени- 
ям доверие выше, т. е. они являются более надежными по сравнению с дру- 
гими, это может быть учтено введением в критерий (1.13.2) положительных 
весовых коэффициентов р»: 


М 
р = (О(х) – 0х), Ох) (х) = Ур, (00) - 70) ә тіп (1.13.6) 
=] 
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ВОПРОС 12 


Закончите следующую фразу: "Для тех точек, степень доверия которым 
выше и к которым аппроксимирующую кривую желательно провести 
ближе, чем к другим точкам, весовые коэффициенты следует задавать 
...". (Больше или меньше?) 


2 
Конечно, больше. Величину р’ можно трактовать как своеобразную "функ- 
цию штрафа". За отклонение О, (х) от / (х) в точке х, к значению р? до- 


2 
бавляется слагаемое ("штраф") (О(х;) – (х,)) тем большее, чем больше это 
отклонение. Если какая-то точка является более приоритетной и к ней ап- 
проксимирующую кривую желательно провести ближе, с помощью весового 
коэффициента за отклонение в этой точке "штраф" должен быть увеличен. 
На практике положительные весовые коэффициенты р, часто задают так, 


чтобы их сумма была равна, например, 1 или 100. Последнее часто удобно, 
но не обязательно. Если все коэффициенты умножить на одно и то же число, 


ТО, ХОТЯ р? и изменится, решение задачи останется прежним. Важными яв- 


ляются отношения р; друг к другу. 


1.13.2. Непрерывный случай. 
Понятие ортогональности 


Теперь обратимся к варианту непрерывного задания (х) на [а, |. Выра- 
жение (1.13.3) предыдушего раздела сохранит свой внешний вид, только ска- 
лярные произведения и критерий р? будут записываться не через суммы, а 
через интегралы 


Б 
(фф; ) = [Ф Оф, О)ах, 


а 


Б 
р2=(О(х) – Ло, О(х) - Ло) = (Оо) - 70) а ә тт. (1.13.7) 


Определитель (1.13.4) оказывается определителем Грама и, как известно из 
алгебры, отличен от нуля, если базисные функции линейно независимы, что 
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имеет место. Система (1.13.3) имеет единственное решение, и полином, дос- 


тавляющий минимум р? ‚ существует. 


В качестве примера обратимся к аппроксимации полиномами Ф, (х) = х* на 


промежутке [0, 1] ‚ Вычисление определителя Грама дает следующий результат: 


| 1/2 1/3 СЕЗУ 
1/2 1/3 1/4 .. Џ00т+ 2) 
а) 108 у4 5 . 1/т+3). (1.13.8) 


И(т+1) 10(т+2) 1(т+3) ... И@т+1) 


Этот определитель называется определителем Гильберта, а соответствую- 
щая ему матрица — матрицей Гильберта. Она, как и матрица системы 
(1.13.5), оказывается плохо обусловленной и характеризуется крайне непри- 
ятным свойством: весьма малые изменения ее элементов приводят к сильно- 
му изменению решения системы. Определитель Гильберта стремительно 
уменьшается с ростом порядка системы: 


т: | 2 3 4 Е 8 9 
С: 1 8.3х102 46х10“ 17х10” .. 2.7х10-33 97х10. 


т е 


Аналогично дискретному случаю критерий р? может быть обобщен введением 
положительной весовой функции р(х). Как и ранее, все формулы сохранят 
свой внешний вид, а скалярное произведение запишется следующим образом: 


Ь 
(Ф, ‚Ф; ) = [Роу (х)ф;(х)ах. 


а 
Обратимся вновь к системе (1.13.3). Многие проблемы ее решения можно 
обойти, если вместо произвольных линейно независимых функций (х)! 
воспользоваться ортогональными функциями 09) (см. приложение 2). 
Напомним, что последовательность функций Ге (х) является ортогональ- 


ной на промежутке [а, 5] с весом р(х), если (2, 2;) = 0, т. е. выполняются 
следующие условия: 


Б 
(21.8:) = [роде (х), (хак = (1.13.9) 


а 


0, если і, 
А> 0, если і = /. 
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Если в дополнение А =1, то такие функции называются ортонормированны- 
ми (т.е. ортогональными и нормированными). Для ортогональных функций 
матрица системы (1.13.3) оказывается диагональной, и каждое уравнение да- 
ет готовое выражение для коэффициента а, : 


р 
ЕЯ _ Ро (х)ах 


1.13.10 
(вв). ) 


р 
[р(х)в 2 сах 


а 


Эти коэффициенты носят название коэффициентов Фурье функции (х) по 


ортогональной системе функций 80(х), 21(х), 85(х), ..., вт (хХ). 


На первый взгляд, использование ортогональных функций снимает все про- 
блемы, связанные с решением системы (1.13.3). Однако ряд вычислительных 
проблем остается. Они связаны с вычислением интеграла в числителе 


(1.13.19). 
Аппроксимирующий полином можно трактовать как разложение исходной 
функции /(х) по ортогональному базису в5(х), (х), 8в5(х), ..., 2„(х): 


Р(х) = ад8о(х)+а81(х)+...+аиет(хХ). 
Начиная с некоторого момента, при добавлении новых базисных функций 
=; (х) их вклад становится невелик по сравнению с уже построенным разло- 
жением, т. е. коэффициенты а; оказываются малыми по абсолютной величи- 


не. Нахождение близкого к нулю значения определенного интеграла сопря- 
жено с трудностями как при аналитическом, так и при приближенном 
вычислении. Если подынтегральная функция принимает внутри промежутка 
достаточно большие по модулю значения, то неизбежно произойдет потеря 
(часто довольно большого числа) верных значащих цифр. В аналитическом 
случае это будет на завершающем этапе вычисления разности первообразной 
на верхнем и нижнем пределах, а в приближенном варианте — при 
использовании квадратурных формул. 


Если исходный набор функций {Фу (х)} не является ортогональным, то, ис- 


пользуя процедуру Грама — Шмидта (см. приложение 2), его можно сделать 
таковым, построив функции { 2, (х)), которые не только станут ортого- 


нальными, но и будут линейной комбинацией функций (фу (х)). Аппрокси- 


мация, таким образом, будет выполняться в том же классе функций. Одним 


3 Зак. 3418 
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из наиболее популярных естественных ортогональных базисов являются три- 
гонометрические функции, т. е. 


1, соѕх, зшх, соѕ2х, зш2х, ..., созшх , зах, ... 


Изучаемые в курсе математического анализа ряды Фурье в рассматриваемом 
нами аспекте являются аппроксимацией функций посредством этих рядов. 
Еще более популярными являются ортогональные полиномы, примеры кото- 
рых рассматриваются далее. 


1.13.3. Ортогональные полиномы 
и их свойства 


Неотъемлемыми атрибутами понятия ортогональности являются промежуток 
интегрирования и весовая функция. Проблема различных промежутков, воз- 
никающих на практике, решается легко. Полиномы для стандартных проме- 


жутков (обычно это [-1, 1] ИЛИ [0, 1]) приводятся в справочниках и учебни- 


ках, а к произвольному промежутку переходят обычной заменой 
переменных. Примером является следующая замена: 
а+Ь Б-а 


Е + 3 ь хє[а,Ь], :є|-1,1]. 


В приводимых примерах остановимся на стандартном промежутке [-1, +1. 


Тогда главной отличительной особенностью различных полиномов будет ве- 
совая функция. 


Ортогональные полиномы Лежандра 


Для этих полиномов весовая функция имеет популярный вид: р(х) =1, и са- 


ми они могут быть вычислены по формуле: 


о 1) хє[-1,1]. (1.13.11) 


п!2” ах" 


Легко заметить, что /,(х) =1, (х) = х, и имеет место следующее рекур- 


рентное соотношение. 


(и+1)1,1(х) – (2и + 1)х1, (х) + пі, (х) = 0. (1.13.12) 
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Тогда для последующих полиномов легко получаем: 


м 3 _ О: 
=. 4 0) = 2—28, Пе г +3 


Ы] КЕЈ 


Г,(х) = 


В такой форме полиномы Лежандра ортогональны на [-1, +1], но не 


нормированы. Квадрат их нормы имеет вид 


п? п э 


| 
_ _ 
Ол: )= 200% а. 


а графики первых четырех полиномов представлены на рис. 1.10, а. 


Ортогональные полиномы Чебышева 


Для этих полиномов весовая функция выглядит следующим образом: 


| 
р(х) = ‚ При хе [-Ь у они могут быть вычислены по формуле 
М1- х? 


Т, (х) = соѕ(п:агссоѕ(х)); Т7(х) =1, Д(х) =х. (1.13.13) 


Как и для полиномов Лежандра, здесь имеет место рекуррентное соотно- 
шение 


Ти (х) = 2х1,(х) – 1, у(х), (1.13.14) 
на основе которого легко получаются последующие ПОЛИНОМЫ. 
Т,(х)=2х°-Ь Т(х)=4х-3х, Т,(х) = 8х 8 +1, ... 


В справедливости (1.13.14) легко убедиться. Подставляя Ф = агссоѕ(х) в оче- 


видное соотношение 


соз(и + 1)ф + соз(и – По = 2 соѕ фсоѕ(иф), 


приходим к (1.13.14). Полиномы Чебышева могут быть представлены и в 
ином виде, отличном от (1.13.13): 


(2! га" ›ү-1/2 
о 1-2 16-х ) | (1.13.15) 
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Как и полиномы Лежандра, полиномы Чебышева в форме (1.13.13) ортого- 
нальны, но не нормированы. Квадраты их нормы имеют вид 


(70,7) = п, (Т, 


| 
1) = А 
| х? 


а графики первых четырех полиномов представлены на рис. 1.10, 6. 


Т, (А) БЕШ п> 0 


Рис. 1.10. Полиномы: а — Лежандра; 6 — Чебышева 


Ортогональные полиномы могут быть построены и на дискретном множестве 
точек. Пусть независимая переменная принимает значения 0, 1, 2, ..., т; а весо- 


вая функция р(х)=1.Полиномы Чебышева степени и задаются формулой: 


п рск 
р„(х)= У 0 асан: ды ‚ п=0,1,..., т. 
к=0 т 


Здесь т и х!) — факториальные многочлены: 


ті = т(т-—1)..(т-К+1); хі = (х 1). (х=). 
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Запишем несколько первых полиномов: 
х х х(х 1 
ВАт(х)=1, ое Ве" 


т т(т-—1)’ 


х(х-1) 20 х(х-1)(х-2) 


В, (х)=1-12^— +30 2. 
т т(т – 1) т(т – 1)(т – 2) 


Если, например, љт = 5, т. е. множество рассматриваемых точек {0, 1, 2, 3, 4, 
5}, то ортогональными на этом множестве точек будут полиномы: 


Р(х) =1, В.(х)=2х-5, Р(х) =3х2 -15х+10, 


Р(х) =10х° – 75х2 +127х 30, ... 


Убедиться в ортогональности этих полиномов можно, вычислив скалярные 
произведения: 
0, і +}, 
Б . і+] 
(Р,„ (х), Р, (х)) =4 (1+ т + 1) 


ЕЛ 
ті1(21 +1) 


Некоторые свойства ортогональных полиномов 


Начнем с теоремы существования и единственности ортогональных полино- 
мов, которую приведем без доказательства. 


Теорема 1. Для всякой весовой функции р(х), удовлетворяющей условиям: 


О р(х) >20 (неотрицательность); 


Б 
п [родах < оо (интегрируемость); 


а 


Ь 
п | р(х)ах > 0 (положительность интеграла) 
а 


существует единственная последовательность полиномов КУ (х)}, где & = 1, 


2, .... п, ... имеющих положительный старший коэффициент и удовлетво- 
ряющих условию ортонормированности. 
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Теорема 2. Ортогональный полином 5, (х) ортогонален произвольному по- 
линому А, (х) меньшей степени: 


Ь 
[0х)5,, (х)А, (х)ах = 0, т>. 


а 

Доказательство. Разделим А, (х) на 5, (х). 
К, (х) = аџ;5, (х) + А, (х), 

где а, — частное от деления старших коэффициентов А, (х) и 5, (х). Далее 
разделим №, (х) на 5,_1(х): 

Ку (х) = ар р(х) + К (5). 
Продолжая этот процесс деления, получим 

К (х) = а, 5, (х)+ К, 1(х) = а; (х) + а, 9,10) + А5 (х) =... 
=а, 5 (х) + алк (х)+...+ аро (х). 

Это разложение полинома А, (х) по ортогональным полиномам 5,(х). Ум- 


ножим обе части равенства на 5„(х) (т > К ) и проинтегрируем с весом р(х) 
на промежутке ортогональности: 


Б Ь Б 
[РОК (х)5„(х)ах = ау [.р(х)8, (х) „(х)ах + ...+ ад [.р(х)80(х)5,, (х)ах. 


Все интегралы в правой части равны нулю, и теорема доказана. 
Теорема 3. Все т корней ортогонального полинома 5, (х) являются веще- 


ственными и лежат на промежутке ортогональности [а, Ь]. 


Доказательство. Разобъем процедуру на три части в зависимости от того, 
каковыми могут быть корни. Доказывать будем от противного. 


Покажем, что нет вещественных корней кратности большей, чем 1. Предпо- 
ложим, что корень х имеет четную кратность 4. Тогда 


Эт (х) = (х м ) Ааа (х). 


Умножим обе части равенства на А„_,(х) и проинтегрируем с весом р(х) на 


промежутке ортогональности: 


р Г, 
[р0х)5, ОА, дах = ро) – х) В? (ха. 
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Интеграл слева равен нулю по теореме 2, а выражение справа содержит под 
интегралом неотрицательную функцию, что приводит к противоречию. Если 
4 принимает нечетное значение, большее единицы, то умножать 5„(х) сле- 


дует на (х ху): А,_„(х) с аналогичными рассуждениями. 


Покажем, что нет комплексных корней. Пусть трехчлен х? +ах+Ь определя- 
ет пару комплексных корней. Тогда 


5х) = (52 +ах+Ь К „_> (5. 


Вновь умножаем обе части равенства на р(х) №, (х), интегрируем на [а, | 


и получаем 
Ь р 
оби В о дах = [рх + ах + Бх) 2 ,(х)ах. 


Снова противоречие, т. к. интеграл слева равен нулю, а справа под интегра- 
лом стоит неотрицательная функция. 


Наконец, пусть х — корень вне [а, 5]. Тогда 


$ (х) = (х — Х] Ки (х). 


Выполнив аналогичные операции, 
Б Б А 
[008 (х), (дах = |ро)(х — ху), (х)ах, 
а а 


вновь приходим к противоречию, т. к. подынтегральная функция справа зна- 
копостоянна. 


Теорема 4. Для любых трех соседних ортогональных полиномов справедли- 
ва рекуррентная формула (разностное уравнение второго порядка): 


2,419,105) + (ат _ х)5т (х) +а,„_19,„ (х) = 0, 
где а, — постоянные (не зависящие от х) коэффициенты. 


Доказательство. Выпишем разложение хб„(х) по ортогональным полино- 


мам, как это делалось в теореме 2 


х9 (х) = 2,1910) +49, (х) + аи лэт—(х)+...+ 2050 (х). (1.13.16) 
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Умножая равенство последовательно на р(х)5,(х), где К =0, 1, .., т-2 и 
интегрируя на промежутке [а, 6], без труда установим, что а), а, ..., а, 


все равны нулю. Действительно, 


Ь Б 
[р0)5, (х)х5„(х)ах = а, ау | рО), (х), дах + 


а а 


Б Б 
+ а, \р(х)5,„(х)5, (х)ах+...+ ар |р()5, (х), (х)ах+...+ 


а а 


Ь 
+ ад | р(%)50(х) 5, (х)ах. 


а 


Интеграл слева всегда равен нулю, а равенство нулю правой части можно 
обеспечить, лишь положив а, =0. Тогда от исходного выражения остается 


хп (х) = +11 (х) + тт (х) 5 Ат т-| (х) 
ИЛИ 

+11 (х) + (а,, Е х), (х) Е 18-1 (х) = 0. 
Еще одно свойство приведем без доказательства. 


Теорема 5. Пусть полином $, (х) имеет корни ху, 25, ..., хи, а полином 


т? 


9 ин (Х) — корни Су, бә, ..., бӧһ блы: Гогда справедливо неравенство 
а<6бр <х <6 <х., <..<6, <х, <6б ы <. 


Из рассмотренных свойств весьма конструктивным выглядит теорема 4, ко- 
торая позволяет строить любые ортогональные полиномы, если известны два 


первых из них. Формулы (1.13.12) и (1.13.14) являются примерами выраже- 
ния (1.13.16). 


В заключение данного раздела вернемся к двум ранее уже объявленным ре- 
зультатам. В разд. 1.4 при выборе узлов интерполирования отмечалось, что 
оптимальный их выбор отвечает нулям ортогональных полиномов Чебышева. 
Опуская строгое доказательство этого факта, отметим лишь, что, как это сле- 


дует из выражения (1.13.13), график модуля Т (х) 


(|7,00) = |соѕ(и агссоѕ(х))) и порождает одинаковые по высоте "колоколь- 


чики", представленные на рис. 1.3. 
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Второе замечание относится к квадратурным формулам Гаусса. Как отмеча- 
лось, узлы х; этих формул являются нулями ортогональных полиномов 
Лежандра. В качестве упражнения установим справедливость этого факта. 
При взятии интеграла вместо исходной функции воспользуемся полиномом 
Эрмита (1.7.2) степени 2т +1. При этом в каждом узле ж, х|, ..., х„ заданы 


функция /(х;) и ее производная /'(х,): 


2 [44 
Нин (= ў 00 1-ти 


(х-ж (ху) о' (ху) 


Подставим полином в интеграл, меняя порядок интегрирования и суммиро- 
вания: 


р р т 6 2 
Де: = [5 „ы (х)ах = У | ах (х) + 


а а к=0 2 (х-хұ)0 (хх) 


т 


2 
| о(х) Е Е 
{у (х;) – о м 0). 0 л) | (х х, )ах 


2 
= У доц) [и БТА =, - и СУЗ 
к=0 


20 о (х,) (х ху) (х) 


В качестве узлов интерполирования выберем нули ортогональных полиномов 
Лежандра и сделаем, таким образом, функцию (х) полиномом Лежандра. 


Первое слагаемое в правой части является квадратурной формулой Гаусса, а 
интеграл во втором слагаемом обращается в нуль. Действительно, для этого 
интеграла имеем 


Ы а(х) | Е у Ы), 
сере НЧ ОТ ЗЕЕ АН т. а == 
1 о р" 


о(х) 
Функция (х) — полином Лежандра, а ———— — полином на степень 


(х ых ху) 
меньше, и по теореме 2 интеграл равен нулю. Погрешность квадратурной 
формулы при этом может быть получена интегрированием остаточного члена 
(1.7.3) полинома Эрмита. 


ГЛАВА 2 


Задачи линейной алгебры 


Традиционно к задачам линейной алгебры относят две большие проблемы: 
решение линейных алгебраических систем 


Ах=Ь (2.0.1) 


и нахождение собственных значений и собственных векторов матрицы А. 
К решению (2.0.1), где А — невырожденная квадратная матрица порядка 
тхт,  — заданный вектор-столбец и х — искомый вектор-столбец, с и 


компонентами каждый, примыкают задачи: 


О решение (2.0.1) с прямоугольными матрицами Х и В (АХ =В); 


94 –1 
О нахождение обратной матрицы А ; 
(С вычисление определителя матрицы А. 


Вторая проблема связана с нахождением собственных значений, удовлетво- 
ряющих уравнению ЯеА АЕ) =0, и собственных векторов, являющихся 
решением уравнения Ах = Ах для всех л. Если матрица А симметрическая, 
задача значительно упрощается, т. к. в этом случае собственные значения 
вещественные. Иногда возникает обобщенная задача на собственные значе- 
ния Ах = АСх, где А — вещественная симметрическая матрица, С — веще- 
ственная симметрическая положительно определенная матрица. 


Еще две задачи можно отнести к вычислительным задачам линейной алгеб- 
ры. В первой из них требуется найти такой вектор х, при котором норма век- 


тора невязки г = Сх 4 минимальна (|Сх-а| > тіп ). Вектор х является 
решением по методу наименьших квадратов обычно несовместной системы 
Сх = 4. Здесь матрица С — прямоугольная с числом строк, превышающим 


число столбцов, а у вектора а столько элементов, сколько строк у матрицы 
С. К этой проблеме мы вернемся в главе 6. 
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Во второй задаче для заданной матрицы А , векторов Б и с требуется найти 
такой вектор х, чтобы выполнялись неравенства Ах>Ь и х>0, а скалярное 
произведение (с,х) было бы минимальным. Матрица А является прямо- 
угольной с числом строк, превышающим число столбцов. Эта задача требует 
специальных подходов и изучается в разделах линейного программирования. 


При решении указанных выше задач встречаются матрицы различных типов. 
Если число ненулевых элементов матрицы порядка числа ее строк, т. е. 
большинство элементов являются нулевыми, то такую матрицу называют 
разреженной. При этом ненулевые элементы либо хранятся с использовани- 
ем специальных типов данных, либо генерируются по мере необходимости. 
В других случаях, когда все а; хранятся в оперативной памяти компьютера, 


матрица называется хранимой. Часто разреженные матрицы возникают при 
конечно-разностных аппроксимациях уравнений с частными производными. 
Примером разреженной матрицы может служить ленточная матрица 


отличные от нуля элементы которой располагаются вблизи главной диагона- 
ли: а; =0 для 1, › удовлетворяющих условию | Л>5, где 5 <т. Число 


25 +1 называют шириной ленты, оно задает количество диагоналей с нену- 
левыми элементами. 
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2.1. Обусловленность матриц 


Численное решение линейных алгебраических систем подвержено влиянию 
нескольких источников ошибок. Два из них традиционны и очевидны: огра- 
ниченность разрядной сетки компьютера и погрешность представления ис- 
ходных данных. Единственное решение система (2.0.1) имеет при 4еКА) = 0. 


Если изменение элементов в пределах точности задания данных с наложени- 
ем на них ошибок округления приведет к нулевому определителю, получить 
единственное решение не удастся. Для анализа возникшей ситуации введем 
понятие обусловленности матриц. 


Первоначально оно появилось, как чисто качественная характеристика чув- 
6 1 

ствительности элементов обратной матрицы А при изменении элементов 

матрицы А. Матрицу А-' называют устойчивой, если малым изменениям 


элементов А отвечают малые изменения элементов А-', и неустойчивой — 
в противном случае. Матрица называется илохо обусловленной, если ее об- 
ратная матрица неустойчива. 


Этот факт прямо связан с "неприятностями" при решении системы (2.0.1), даже 


когда она имеет единственное решение (х = А-ЪЪ). Если матрица плохо обу- 
словлена, то малое изменение элементов А или Б приводит к заметному из- 
менению решения. Получим количественную характеристику этого явления. 


Первоначально будем считать, что матрица А известна точно, а вектор Ь — 
с некоторой погрешностью АБ. Тогда система приобретет вид 


А (х+Ах) =6 + 
или после вычитания (2.0.1) и обращения матрицы: 
ААх= ЛЬ; Ах=А "АВ. 
Далее при использовании любой нормы матрицы, согласованной с нормой 
вектора х, получаем 


ах [Ат (Аы. ІЫ <А. 


Перемножение этих двух неравенств в предположении, что Б + 0, и деление 
на [Ы Ы[лает 


А АЬ 
са ЕТУ. РРР АА". (2.1.1) 


ХІ Ы] 
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Число сопд(А)= АА будем называть стандартным числом обусловлен- 


ности. 


Вычисляя норму от обеих частей равенства А. А! =Е ‚ имеем А] А | > Е, 


т.е. сопа(А)>1. Равенство (2.1.1) допускает простую интерпретацию для 


практики. Число обусловленности матрицы А является верхней границей 
"усиления" относительной ошибки вектора Б, т. е. относительное изменение 
вектора Ь влечет за собой относительное изменение в решении не более чем 
в сопа(А) раз. Если величина сопа(А) невелика, то говорят о хорошей обу- 


словленности матрицы А ‚ в противном случае — о плохой. 


На практике плохая обусловленность часто сопровождается малой величиной 
определителя матрицы 4еКА). В связи с этим широко распространено за- 
блуждение, что малость 4еКА) всегда сопровождается большим числом обу- 
словленности сопа(А). Однако это не всегда так. Так, например, для матри- 


цы А=5Е ее определитель (4е(А) ==”) может быть близок к нулю при 


больших размерах т матрицы А и сравнительно не малых є <1. Однако 
матрица А не является плохо обусловленной и не вызывает проблем с реше- 
нием (2.0.1). Для норм и 


число обусловленности минимально 


(сопа(А) = [АА | =1), а для 


|- 


сопа(А) = тв. = т. 
5 


[е ©) 


ОНО не слишком велико: 


Для иллюстрации рассмотрим систему (2.0.1) с параметрами 


1.00 0.99 1.99 


А = ‚№ = Л. 
0.99 0.98 1.97 9 


точным решением которой являются: х(0) = 1, хб?) =1. Небольшое изменение 
в исходных данных резко изменяет решение: 
1.989903 —0.000097 +2.0000 +3.0000 


Ь+ АБ = ‚ АБ = ‚ Ах = ‚ Х+Ах = | 
1.970106 +0.000106 —2.0203 —1.0203 


Непосредственное вычисление оценки из (2.1.1) дает соп4 (А) ~ 40 000. 


Для этого простого случая есть хорошая геометрическая иллюстрация. Каж- 
дому уравнению системы соответствует прямая на плоскости, а точка пере- 
сечения этих прямых дает решение системы. Исходным данным (2.1.2) каче- 
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ственно отвечает на рис. 2.1 случай (3): прямые пересекаются под очень ост- 
рым углом, и малейшее изменение исходных коэффициентов А или Ы зна- 
чительно влияет на расположение точки пересечения. Случай (Т) демон- 
стрирует хорошую обусловленность, а случай (2) — отсутствие решения при 
нулевом определителе. 


08 0.6 0.5 
0.55 
07 0.45 
0.5 
0.4 
0.6 0.45 
0.35 
4 
0.5 у 
0.35 0.3 
04 
0.3 0.25 
т 0.25 
0.2 
0.2 
0.2 
0.15 0.15 
0.1 0.1 0.1 
0 0.5 0 0.5 ре 0.5 


(1) (2) (3) 
Рис. 2.1. Геометрическая иллюстрация решения линейной системы 


Теперь рассмотрим ситуацию, когда вектор Ь известен точно, а коэффици- 
енты матрицы А заданы с погрешностью АА: 


(А + ЛА)(х+ Ах) =Ъ. 
Вычитая из этой формулы равенство (2.0.1), получаем: 


АЛх = -ЛА (х + Ах), 


[ах [А АА-А], 


ЛА] опасду А, (2.1.3) 
|х + Ах] [А] 
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И в этом случае сопа(А) ограничивает сверху увеличение относительной 


ошибки решения по сравнению с относительной ошибкой исходных данных. 
Если в примере (2.1.2) заменить элемент а, на а>> + Ла›, = 0.9802, то "воз- 


мущенное" решение не будет совпадать с исходным даже по знаку 
(х0) =2.98, хі) =-1.00). 

В заключение следует отметить, что число обусловленности дает завышен- 
ную (иногда значительно) оценку погрешности. Трудности вычисления 
сопа(А) связаны с неприятностями при нахождении А-'. Если вычислять 
А-', то время, требуемое для нахождения решения, например, методом Гаус- 
са, заметно возрастает. Однако часто вместо сопа(А) вполне устраивает лю- 
бая разумная оценка. Из многих применяемых способов оценки сопа(А) 


приведем один из широко используемых: 


|21 


аА) ғ „НП 
сопа(А) тах |а| У] 


где у и 2 — такие векторы, что А/У|= А, а, — столбцы матрицы А. 
Векторы у и 2 находятся из решения двух систем: АГу=е и А2 = у, где 


А! — транспонированная матрица, а е — вектор с компонентами, равными 


+1. Очевидны неравенства: А Ы А |< |21705. Вектор е выбира- 
ется специальным образом, чтобы увеличить надежность оценки. 


Механизм влияния погрешности в задании элементов А на решение (2.0.1) 
интересно рассмотреть и с другой стороны, анализируя собственные значе- 
ни А и А!. Предварительно обратимся к двум положениям. 

Положение 1. Максимальные по модулю элементы матрицы А имеют вели- 
чину, по меньшей мере, порядка максимальных по модулю собственных зна- 
чений матрицы | (а может быть, и значительно их превышают). Дейст- 


вительно, это положение прямо следует из неравенства, связывающего 
собственные значения и норму матрицы: А | < [А] 


Положение 2. Пусть А, — собственные значения матрицы А. В "возму- 


щенной" матрице А + ЛА собственные значения могут измениться на вели- 
чину порядка элементов матрицы возмущений ДА. 
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В качестве примера достаточно обратиться к матрице А + АДА = А + ЕЕ, все 
собственные значения которой изменились на одну величину: ДА, = є. 


На практике положение 2 часто имеет место, хотя можно специально таким 
образом выполнить достаточно большое возмущение, что в матрицах А и 
А + ЛА собственные значения не изменятся. Например: 


1-1 5 | 
А = А А + ЛА = А А = 2, А.2 =3. 
2 4 —6 0 


Пусть теперь предельная относительная погрешность задания элементов 
матрицы А равна д. Тогда в соответствии с положением | максимальные по 
модулю элементы матрицы ЛА , по меньшей мере, имеют величину порядка 


бА |: В соответствии с положением 2 на эту величину могут измениться 
все собственные значения возмущенной матрицы. 

Если величина б мала, то максимальные по модулю собственные значения 
матрицы А изменятся незначительно. В то же время, если разброс между Л, 
велик, минимальные по модулю собственные значения А, могут измениться 


весьма существенно. Но величина, обратная минимальному по модулю соб- 
ственному значению матрицы А , является максимальным по модулю собст- 


е1 1 1 
венным значением для обратной матрицы А, элементы которой претерпят 
существенные изменения. Вместе с ними изменятся весьма сильно и компо- 
ненты вектора решения системы (2.0.1). 


Описанный эффект будет проявляться тем сильнее, чем больше разброс соб- 
ственных значений матрицы А, что в свою очередь, как исопа(А), может 


служить количественной етет плохой обусловленности матрицы. 


‚ а также пата < т |А ‚ для плохо обусловленных 
матриц имеем: 
тах | 
соп(А) = ААТ |> тах. пахі = 6—1. 
Бег 


Теперь попытаемся ввести число обусловленности несколько иначе. Пусть 
возмущенная задача имеет вид. 


А(х+ Ах) = + г, (2.1.4) 
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где г отражает оба возмущения (и в матрице А, и в векторе Б), т. е. возму- 
щение в матрице АА перенесено в правую часть и включено в г. Это не со- 
всем правильно, т.к. АА умножается на х, но мы пытаемся получить лишь 
грубую оценку. Вычитая (2.0.1) из (2.0.4), имеем 


АЛх =г 
ИЛИ 
Ах=А №. 


Перейдя к нормам, получим 
Ам 


Это оценка абсолютной погрешности. Для относительной погрешности она 
имеет вид 


хр ЈА АННЫ 


[Ах] = сопа, (АЕ |= |] где опа А) Ы. (2.1.5) 


Ы Ы. ||. (х! 


Это неравенство определяет естественное число обусловленности. Оно не 
очень удобно, т. к. является апостериорным (оно зависит от |х|, а х не из- 


вестен априори). Исключение х приведет к стандартному числу обуслов- 
ленности. Это делается следующим образом. ИЗ (2.0.1) следует 


АН или 1А 


АЕ № 


Подставляя это неравенство в (2.1.5), получаем уже известную оценку 


И ЈА ЧЫЧАТ 
НЫ ЫЫ 


Обратим внимание еще на один аспект интерпретации неравенств (2.1.1) и 
(2.1.3). Если значение сопа(А) мало (близко к единице), то относительно ма- 


– |А. |А |. а, 


Ы 


лое изменение исходных данных обязательно приведет лишь к малому изме- 
нению решения. Если же значение сопа(А) велико, то малые изменения ис- 


ходных данных могут привести (но не обязательно приводят) к большому 
изменению решения. 

В зависимости от числа двоичных разрядов, представляющих вещественные 
числа в данном компьютере, существует "критическое" число обусловленно- 


сти. Если, например, сопа(А) = 105, то в решении может быть потеряно 
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шесть десятичных знаков. При длине мантиссы в семь десятичных разрядов 
это оказывается "вычислительной катастрофой", в то время как при работе с 
двойной точностью (15 десятичных разрядов) проблем может не быть. Фор- 
мализовать это можно следующим образом. 


Точность машинной арифметики характеризуется посредством "машинного 
эпсилон", т.е. наименьшего числа с плавающей точкой &, такого, что 
1Ф=>1, где Ф — сложение на компьютере. При записи в оперативную па- 
мять элементов матрицы А предельная относительная погрешность состав- 
ляет не менее =. Как следует из приведенных ранее утверждений, только 
этого искажения исходной информации вполне достаточно, чтобы решение 
не имело ни одного верного знака, если число обусловленности удовлетворя- 
ет условию сопа(А)>1/= (разумеется, здесь предполагается, что соп@ (А) не 
является слишком завышенной мерой плохой обусловленности). Последнее 
замечание не излишне, поскольку при решении системы (2.0.1) с диагональ- 
ной матрицей А не возникает проблем, в то время как сопа(А) может быть 


очень большим: 


10* 0 у [10 0 , 
А = ‚А = 4) сопа(А) = 10". 
о 10“ о 10 


2.2. Метод Гаусса. ЕЧ-разложение матрицы. 
Программы РЕСОМР и 5ОЁУЕ 


Различают два больших класса методов решения систем (2.0.1): точные (или 
прямые) и итерационные. Точные методы за конечное число арифметиче- 
ских операций при отсутствии ошибок округления (что эквивалентно беско- 
нечной разрядной сетке) дают точное решение задачи. В ходе применения 
итерационных методов рождается последовательность векторов, сходящаяся 
к решению. 


В качестве наиболее популярного представителя методов первой группы рас- 
смотрим метод Гаусса исключения неизвестных. Одна из его примитивных 


модификаций предполагает на первом шаге исключение х() с помощью пер- 
вого уравнения из остальных уравнений. С этой целью первое уравнение ум- 
ножается на ту =-а/а! и складывается с К-м уравнением и т. д. На вто- 


ром шаге с помощью преобразованного второго уравнения исключается хб?) 


из последующих уравнений. После исключения хб") завершается так назы- 
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ваемый ирямой ход метода Гаусса, результатом которого является верхняя 
треугольная матрица. Обратный ход метода Гаусса (гораздо менее трудоем- 
кий) сводится к последовательному получению неизвестных, начиная с по- 
следнего уравнения. 


Алгоритм в таком виде нуждается в существенном замечании. Нельзя заранее 
предвидеть, что элемент, стоящий в левом верхнем углу обрабатываемой 
матрицы, всегда будет отличен от нуля. Если ситуация с нулевым элементом 
возникнет, то, чтобы избежать деления на ноль, необходимо переставить 
строки, сделав элемент в этой позиции (ведущий элемент) ненулевым. Более 
того, желательно избегать не только нулевых, но и относительно малых ве- 
дущих элементов. Подтвердим это примером: 


0.100-1073 . х0) +0.100-10'. х) = 0.100 -10', 
0.100 -10' х) + 0.100 -10'- х2) = 0.200.10'. 


Решение с малым ведущим элементом аџ = 0.100 1073 с шестью десятичны- 
ми знаками таково: х(!) = 1.00010, х) = 0.999900, а с тремя знаками: 
х = 0.000, х(2) =1.00. Очевидно, что произошла "вычислительная катаст- 
рофа". Переставив уравнения (теперь а | =0.100.10'), решим систему с тре- 


мя значащими цифрами: х() =1.00, х) =1.00. (Рекомендуется самостоя- 
тельно проделать вычисления, корректно округляя.) 


Наиболее известны следующие две стратегии выбора ведущего элемента. 


Г] Вариант 1 — полный выбор. Здесь на К-ом шаге в качестве ведущего бе- 
рется наибольший по модулю элемент в неприведенной части матрицы. 
Затем строки и столбцы переставляются так, чтобы этот элемент поме- 
нялся местами с аш. В этом случае каждый раз осуществляется деление 
на максимальный элемент, но перестановка столбцов фактически сводит- 
ся к перенумерации компонентов вектора х. 


О Вариант 2 — частичный выбор. Здесь на К-ом шаге в качестве ведущего 
используют наибольший по модулю элемент первого столбца неприве- 
денной части. Затем этот элемент меняют местами с ад, для чего пере- 


ставляют только строки, избегая перенумерации компонентов вектора х. 
В ходе многочисленных машинных экспериментов установлено, что, как 


правило, частичный выбор лишь немного уступает полному в скорости роста 
ошибок округления. При этом полный выбор гораздо более трудоемок, тре- 
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бует перенумерации переменных при перестановке столбцов и увеличивает 
время получения решения. 


С современной точки зрения метод Гаусса интерпретируется как разложение 
матрицы системы (2.0.1) в произведение двух треугольных матриц (0- 
разложение). Этот факт отражает следующая теорема, приводимая без дока- 
зательства. 


Теорема. Пусть Аб) — главные миноры квадратной матрицы А порядка 
тхт (К=1, 2, .... т-1). Предположим, что бед) 0. Тогда существу- 
ют единственная нижняя треугольная матрица 0= (1; ), где 
П = 1) =...=1,, =1, и единственная верхняя треугольная матрица 0 = (и,,), 


такие, что 10 = А. Более того, де (А) = и: и ·...:и,. 


Эта теорема позволяет представить решение (2.0.1) как решение двух систем 
с треугольными матрицами ЕР и О: Іу = и Ох =у. Решение первой сис- 
темы с одновременным вычислением Г и О соответствует прямому ходу 
метода Гаусса, а решение второй системы — обратному ходу. Технологию 
С-разложения проиллюстрируем на примере системы четвертого порядка 
без выбора ведущего элемента. Пусть ти = -аџ/ај (К = 2, 3, 4). Первый 
шаг прямого хода эквивалентен умножению матрицы А и вектора Б слева 
на матрицу М; : 


1000 
№ № 1 0 0 Е Е 
М, = ‚ А, =МА, Ь,=МЬ. 
713 | 010 
14| 0 0 ] 


На втором шаге матрица А, и вектор Б, умножаются на матрицу М,, а на 


третьем шаге матрица А; = М,А, и вектор Б; = М,Ь, умножаются на мат- 


| 09/0 2) / (2 
рицу М; (А. =М.М,МА ): т; =-а 2) а), тұз = -а(2 /а0), 


1000 1 ооо 
0100 01 о0о 
М, = ‚ М; = 
ош то оото 
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Согласно построению Ал есть верхняя треугольная матрица О: 


М = М,М,М,;, МА = 0, = М, А=Х, 


где 
| 0 0 
—п | о 0 
г=| 2! | 
-т, фт) 1 0 
—т —"4ә ф-та 1 


Здесь учитывалось, что произведение однотипных треугольных матриц — 
это треугольная матрица того же типа, а обратная матрица для треугольной 
(нижней или верхней) является треугольной того же типа. 


Теперь сформулируем ряд условий, которым должна удовлетворять совре- 
менная программа, реализующая метод Гаусса. Нужно предусмотреть: выбор 
ведущего элемента, эффективное решение нескольких систем уравнений 
(2.0.1) с одной и той же матрицей А и различными векторами Ъ, оценку чис- 
ла обусловленности. Реализованные в большинстве пакетов по линейной 
алгебре программы представляют собой набор из двух программ. В первой 
осуществляется ГО-разложение, а во второй решаются две системы с тре- 
угольными матрицами В и О (Ту=Ь и Ох =у). Примером являются напи- 


санные на Фортране программы РЕСОМР и ЗОТ\Е из [14]. Программы имеют 
следующие параметры: 


РЕСОМР (МОТМ, М, А, СОМО, ТРУТ, МОВК) 
ЅОУЕ (МРТМ, М, А, В, ТРУТ) 


где: 


С мотм — объявленная в описании строчная размерность массива, в кото- 
ром располагается матрица А; 


№ — порядок системы уравнений; 


С А — матрица, подвергающаяся разложению (по окончании работы 
программы на ее месте располагаются матрицы [и О), 


сомо — оценка числа обусловленности; 
ТРУТ — вектор индексов ведущих элементов (размерность №); 


мокк — рабочий одномерный массив (размерность м), 


ооо 


в — вектор правых частей системы (2.0.1), где по окончании работы про- 
граммы 5от\Е размещается вектор решения х. 
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Иногда функции ресомр и зогу возлагаются на одну программу, имеющую в 
таком случае управляющий параметр. В ряде случаев предлагается совокуп- 
ность разнообразных программ для решения систем (2.0.1) с различными 
матрицами (общего вида, ленточными, трехдиагональными, положительно 
определенными, симметрическими и пр.). 


В заключение оценим число арифметических операций в методе Гаусса. На 
каждом шаге исключения мы встречаемся с операциями деления и умноже- 
ния-вычитания. Возьмем за единицу измерения операцию именно такого ти- 
па. На А-ом шаге в одной строке выполняется одно деление и К умножений- 


вычитаний. Тогда для всех & – 1 строк имеем: (А + 1)(& ~ 1) = 1 операций. 
В прямом ходе Гаусса таких шагов т. В итоге получаем: 

я А079 2т? + Зт? – 5т 

У (к -1)= т. 

К КА 6 
При больших значениях т хорошим приближением для числа операций бу- 


дет т? В. Для обратного хода нужно на порядок меньше операций (одно де- 


ление и &-] умножение-вычитание при вычислении х(К) что для всех ком- 


Ц п? + т 


понентов дает величину У К = - 
А 


). Для сравнения: в формуле Крамера 
требуется выполнить т! (т? -1) операций. (Вычисление одного определите- 
ля т-ого порядка требует т!(т-1} умножений, а всего нужно вычислить 


т+1 определитель, значит, всего т! (т? —1. Если т=10, то для 10- 


разложения число операций 102/3 ‚а для формул Крамера 10х99 =3 х] 08.) 


2.3. Итерационные методы 


Итерационные методы (еще одно название — методы последовательных 
приближений) дают возможность для системы (2.0.1) Ах =Ъ строить после- 


довательность векторов хо, хү, ..., х,, ... пределом которой должно быть 


ж 
точное решение х . 


х = |ітх,. (2.3.1) 
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На практике построение последовательности обрывается, как только дости- 
гается желаемая точность. Чаще всего для достаточно малого значения є > 0 


* 
контролируется выполнение оценки х х, ес: Метод последовательных 


приближений может быть построен, например, по следующей схеме. Эквива- 
лентными преобразованиями приведем систему (2.0.1) к виду 


х= Сх +. (2.3.2) 


Под эквивалентными преобразованиями будем понимать преобразования, 
сохраняющие решение системы (т. е. решения (2.0.1) и (2.3.2) совпадают). 


ж 
Точное решение х системы (2.3.2) имеет вид 


х -(Е-С) а. (233) 
Вместо (2.3.2) будем решать систему разностных уравнений (2.3.4) 
х„+| = Сх, +9 (2.3.4) 


пошаговым методом. При этом необходимо решить целый ряд вопросов. 
Сходится ли итерационный процесс (2.3.4)? Если сходится, что является пре- 
делом последовательности и какова скорость сходимости? 


Легко заметить, что система (2.3.4) имеет вид (13.18). Поэтому в соответст- 
вии с (П3.20) решение (2.3.4) записывается в виде 


х, = С"хо + (Е-С")(Е-С)'а. (2.3.5) 
Вычитая из (2.3.5) точное решение (2.3.3), получаем 


хх’ = С" - С" (ЕС) "а= С" (ху х"). (2.3.6) 


Чтобы обеспечить условие сходимости (2.3.1), все элементы матрицы С” 
должны стремиться к нулю при и о. Для этого, в свою очередь, необхо- 
димо и достаточно, чтобы все собственные значения матрицы С были бы по 
модулю меньше единицы: 


[А | <1. (2.3.7) 


Последний факт подробно поясняется в разд. ПЗ.9, где определяются условия 
асимптотической устойчивости решения системы (2.3.4). Поскольку нахождение 
всех собственных значений доставляет значительные трудности, с учетом (113.9) 
вместо условия (2.3.7) можно использовать достаточное условие сходимости 


|С <1, (2.3.8) 


которое справедливо для любой канонической нормы. 
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Количество итераций по формуле (2.3.4) будет тем меньше, чем меньше по 


ж 
модулю собственные значения матрицы С и чем ближе к х выбрано на- 
чальное приближение ху. На практике при реализации на компьютере про- 


цесс (2.3.4) прерывается либо заданием максимального числа итераций, либо 
условием |х – х | <=. Таким образом, основным неформальным моментом 


является такое приведение системы (2.0.1) к виду (2.3.2), чтобы выполнялось 
условие (2.3.8). В общем случае универсальный способ такого перехода с ма- 
лой трудоемкостью отсутствует, и поэтому часто используется специфика 
решаемой задачи. Рассмотрим следующий пример. 


Пусть диагональные элементы матрицы А в (2.0.1) значительно превышают 
по модулю остальные элементы в соответствующих строках. Разделим каж- 
дое уравнение на соответствующий диагональный элемент и получим 


= ~ 


Ах =, х=(Е-А)х+Б. 


Р 


На главной диагонали у матрицы А стоят единицы, а у матрицы (Е-А) 


расположены нули. Вне главной диагонали у обеих матриц находятся малые 


по модулю элементы, что позволяет, выбрав С =Е-А, легко обеспечить ус- 
ловие (2.3.8) и быструю сходимость итерационного процесса (2.3.4). 


Рассмотрим несколько примеров итерационных методов. С этой целью, 
предполагая, что все диагональные элементы матрицы А отличны от нуля, 
преобразуем (2.0.1) к виду 


а, та о. р 
у) - У 300 У ро рер 2. т. (2.3.9) 
у 9 ј=к+1 дк ац 
(К) 


Здесь матрица А имеет размер тх, а х — К-ый компонент вектора х. 


Для хб? первая сумма в (2.3.9) отсутствует. Как и ранее, обозначая номер 
итерации нижним индексом, вместо алгебраической системы (2.3.9) пошаго- 
вым методом будем решать следующую систему разностных уравнений: 

ау 


а. т | ь® 
х0 УО у +, &=1,2,..т. (23.10) 
Ј=1 ік ј=к+1 к ащ 


Этот метод получил название метода Якоби. Анализируя формулу (2.3.10), 
(К) 


(Л 
піл Значения хоу для ј < уже 


легко заметить, что к моменту вычисления х иа] 


определены. 
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Это позволяет модифицировать (2.3.10) 


Га, т а,. К 
А А А 
е =->, - И = х - уз = 1523 .... Ш (2.3.11) 
= Ч ј=к+1 дк ад 
и получить метод Гаусса — Зейделя. 


Оба эти метода можно записать в матричном виде, вводя следующие обозна- 
чения. Пусть № — диагональная, А — левая треугольная, а А, — правая 


треугольная матрицы. А; и А, имеют нулевую главную диагональ. Ненуле- 


вые элементы всех трех матриц совпадают с соответствующими элементами 
матрицы А, и можно записать А = А! + Ю + А,. Тогда формула (2.3.10) запи- 


сывается следующим образом: 


х= -Ю Ах, = Ах, + р Ь 
ИЛИ 
"(х,у -х,) + Ах, =, (2.3.12) 


а (2.3.11) принимает вид: 
Хн = 1А ух, – р Ах, + рг! 
или 
(0 +А, (х, -х„) +Ах, =. (2.3.13) 


Вид формул (2.3.12) и (2.3.13) подсказывает путь к возможному обобщению. 
С этой целью добавим к левой части (2.0.1) следующее нулевое слагаемое: 


вх 


+ Ах =. (2.3.14) 
ДЕ 


Теперь вместо системы алгебраических уравнений (2.3.14) предлагается ре- 
шать следующую систему разностных уравнений пошаговым методом: 


Х = А 
В, 1—8 + Ах, =. (2.3.15) 


Формула (2.3.15) называется канонической формой одношагового итераци- 
онного метода и охватывает алгоритмы, чьи разностные уравнения в мат- 
ричной форме имеют первый порядок. Здесь В„.; — матрица, задающая ите- 


рационный метод, т,., — итерационный параметр. Если В, = Е, то метод 
называют явным, а в противном случае — неявным. Если матрица В, и 
итерационный параметр т,„.; постоянные и не зависят от номера итерации 
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(Ви = В, т, =т), то метод называют стационарным, и нестационарным — 
в противоположном случае. Использование неявных методов сопровождается 
обращением матрицы В, |. Поэтому, для сохранения эффективности алго- 
ритма эта матрица должна быть легко обратима (например, В, является 
диагональной, треугольной или ортогональной). Приведем некоторые примеры. 


С Метод простой итерации. Здесь В, = Е, а т, =т. 


О Итерационный метод Ричардсона. Здесь В, = Е, а т, — переменный 
параметр. 


О Метод Якоби. В, =Б, ат, | =1. 


С Метод верхней релаксации. В, = В +оА}, т, = 0, 0 <0 < 2, где ® — 
заданный числовой параметр. Для о = 1, как частный случай, получается 


метод Гаусса — Зейделя. Для симметрических положительно определен- 
ных матриц А условие 0 < о < 2 является условием сходимости метода. 


Скорость сходимости явных итерационных методов часто оставляет желать 
лучшего. Если матрица А плохо обусловлена, то требуемое число итераций 
целого ряда методов прямо пропорционально числу обусловленности. Для 
повышения скорости сходимости используются два пути. Первый из них 
предполагает применение нестационарных методов с эффективным выбором 
параметра т„.; на каждом шаге. Второй путь — использование неявных ме- 


тодов. Формально анализ свойств неявного метода может быть сведен к рас- 
смотрению явного метода с матрицей ВА. Эффективный выбор В позво- 
ляет заметно уменьшить число обусловленности. Возможна и комбинация 


обоих подходов. Подробное освещение этих и других вопросов, касающихся 
свойств итерационных методов, можно найти в [13]. 


Остановимся на сравнении прямых и итерационных методов. Чаще всего 

преимущества итерационных методов сказываются в следующих ситуациях. 

С Имеется хорошее начальное приближение ху к точному решению (2.0.1), 
что обеспечит сравнительно малое число итераций в (2.3.15). 

П Удалось получить матрицу С в (2.3.4) с весьма малыми по модулю соб- 


ственными значениями, что Гарантирует высокую скорость сходимости 
итерационного процесса. 


П Матрица А является разреженной, и в оперативной памяти компьютера 
хранится относительно небольшое число ее ненулевых элементов. Ис- 
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пользование формулы (2.3.15) требует лишь написания специальной про- 
граммы умножения разреженной матрицы на вектор, в то время как в 
процессе реализации точных методов и преобразования матрицы А мо- 
жет происходить заметное увеличение ненулевых элементов. 


В заключение данного раздела рассмотрим популярного представителя так 
называемых методов вариационного типа — метод минимальных невязок. 
Формула этого метода полностью отвечает (2.3.15). Здесь вводится вектор 
невязки г, = Ах, —Б, характеризующий удаление х, от точного решения 


системы (2.0.1). Каждое новое приближение вычисляется по формуле 
Хи+1 — Хр 111 (2.3.16) 


а параметр 7, выбирается из условия минимума длины вектора невязки на 


каждом шаге. Умножим (2.3.16) на матрицу А и вычтем из обеих частей ра- 
венства вектор 0: 


Е и тА. 


Тогда для скалярного произведения (г, ,1,г,;)) имеем 


(т | ) Б (7 = тА, Г, — ТА! ) = 


= (г,,г,)-27,.1(Аг,,г,)+12.1(Ар,, Ат, ). 


И? И 


Удовлетворяя условие минимума и дифференцируя это выражение по т, с 


приравниванием нулю производной, получаем 


-2(Аг,, г, )+ 27,1 (Аг,, Аг, ) =0, 


Ии? И 


(Аг г,) 


пи 


+ (Аг, Аг). (2.3.17) 


Выражения (2.3.16) и (2.3.17) являются рабочими формулами метода. 


Методы (2.3.15) являются одношаговыми. Повышениє порядка разностного 
уравнения позволяет получить качественно иные результаты. 


2.4. Метод сопряженных градиентов 


Метод сопряженных градиентов предназначен для решения системы (2.0.1) 
с симметрической положительно определенной матрицей А. Для изложения 
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его рабочих формул необходимо ввести понятие А-ортогональности. После- 


довательность векторов {; } называется А-ортогональной, если (Аз, 3, )= 0 
для Ё % |. 


Суть метода сводится к следующему. На основе последовательно вычисляе- 


мых линейно независимых векторов невязок к, п, ..., Г,, ... 


= Ах, Б (2.4.1) 


одновременно с их получением с использованием процедуры Грама — Шмид- 
та, строится система А-ортогональных векторов $, : 


$1 = К, Я = 


„Хв р, С 


б (Аз, 5, ) бе» 


В этих обозначениях итерационный метод записывается в виде: 


(2.4.3) 


п-і ип > 


Д (г0,8,) 
— ОФ 89 . = Хх === 
= У 


Формулы (2.4.1)—(2.4.3) лежат в основе метода, а весь последующий мате- 
риал посвящен его свойствам и улучшению рабочих формул. Умножая (2.4.3) 
на А и вычитая Б из обеих частей результата, получаем: 

п 
= г, -0,Аѕ, =г – },0 А . (2.4.4) 


Обратимся к скалярному произведению (ғ, $ ). Если К>и, то слагаемые от 


суммы в правой части (2.4.4) равны нулю и, таким образом, 
(84) = (10,8,), >и. (2.4.5) 


А для и> А имеем 


и 
(5) = (10,8) 0 ,Азу, 5, |= (ко, )- 04 (Аѕ,, 8) = (0,5) (пк) =0, 


(0,8) = 0, п>. (2.4.6) 
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Наконец, рассмотрим скалярное произведение (т„,г,). В соответствии с 
формулой (2.4.2) г, является линейной комбинацией векторов $, $, ..., 


5,41: Тогда на основе (2.4.6) легко получаем: 


(км) =0, п> +1. (2.4.7) 


Иными словами, векторы невязки, вновь получаемые на каждом шаге, орто- 
гональны всем предыдущим векторам невязки! Процесс заканчивается за т 
шагов, где т — размер всех векторов, и метод сопряженных градиентов ока- 
зывается точным, а не итерационным! Осталось несколько улучшить рабо- 
чие формулы. Последовательно учитывая формулы (2.4.5), (2.4.2) и (2.4.6), 
получаем 


(го, Зи) = (т, 5) = Е г) 


и для а, в формуле (2.4.3) получаем новое выражение: 


Кее 
а, < (ль) (2.4.8) 


(Аз, 8 ) 
Хотя аналитически они одинаковы, векторы в числителе (2.4.8) имеют значи- 
тельно меньшие элементы, что позволяет уменьшить вычислительную по- 
грешность. Теперь уточним выражение для 0; в (2.4.2). Непосредственно с 


учетом (2.4.4) следует: 


Гог. Аѕ г г-г,.Г 
У. ( рт, (ғ, уг, 
АѕЅ$ =———; р о ——————————— дд 


0 | е (Аѕ ,ѕ,) 0, (А в). 


С учетом (2.4.7) для ј<п все коэффициенты 6, обращаются в нуль 


(5, = 0, / <и), а для единственного в (2.4.2) ненулевого коэффициента 2, 


имеем: 


(Азы) (т) (вы) 
ип — А == А а . (2.4.9) 
( 5,8.) о, ( 8,5.) (теа) 
Подведем итоги. Предварительные вычисления состоят в нахождении векто- 
ра невязки гу = Ах, – по выбранному вектору хо и принятии $; = 6. 
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Далее по рекуррентным формулам на каждом шаге последовательно вычис- 
ляются 


Хх, =Х 


п п-1 — Ч изн, 


Гр = 1,1 „Аи > 


и (гр, ) | 
пп — ( ) › 
Ги-1513-1 
Зи = и Ь изн 
Для выполнения одного шага нужно ОДНО умножение матрицы на вектор, 
вычисление двух скалярных произведений и вычисление трех векторов. 


Как уже отмечалось, метод сопряженных градиентов является точным. Како- 
ва причина такого его превосходства над методами предыдущего раздела? 
Для ответа на этот вопрос последовательно выполним преобразования: 


Хин = Хр Ч ии = Хи — 9+1 (Ги - 0..3: 


и+1 — Хи Ша. 
+6, $, Ах, -Б = 0; 
+1 
ХХ р 
ииту х1) + Ах, -Ь = 0. 
06 +1 ея 


Исключив все промежуточные переменные, легко заметить, что разностное 
уравнение имеет второй порядок, а не первый, как ранее, что и является зало- 
гом успеха. 


На практике ошибки округления не позволят за т шагов получить точное 
решение, что будет означать нарушение ортогональности р, . Однако итера- 


ции можно продолжать, компенсируя ошибки округления. Для хорошо обу- 
словленных систем удачный выбор ху позволяет значительно уменьшить 


число итераций, а для плохо обусловленных систем удовлетворительные ре- 
зультаты можно получить увеличением числа итераций. Метод может ис- 
пользоваться для уточнения решения после применения метода Гаусса. 


К сожалению, метод сопряженных градиентов предназначен лишь для сим- 
метрических положительно определенных матриц. Эту проблему решает 
трансформация Гаусса, состоящая в умножении системы Ах = слева на 
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А’: АГАх= А! Ь. Матрица А! А положительно определена и симметрична, 


Т Т 
а система А Ах = А Б имеет то же решение, что и система Ах =}. Следует, 
однако, заметить, что трансформация Гаусса очень сильно ухудшает обу- 
словленность системы, и этот прием не всегда приносит успех. 


2.5. Решение проблемы 
собственных значений 


Проблема собственных значений подразумевает отыскание чисел А, А, ..., 
Лим (в общем случае комплексных) и соответствующих ненулевых векторов 


шу, и, ..., и, удовлетворяющих уравнению 
Аи = ли, 


где А — заданная матрица размера тх т. Все методы делятся на две груп- 
пы. С одной стороны, это методы, предназначенные для решения полной 
проблемы собственных значений, когда определяются все собственные зна- 
чения матрицы. С другой стороны, это методы, решающие частичную про- 
блему собственных значений, когда определяются только некоторые А, . Так 
же, как и при решении систем линейных алгебраических уравнений, перво- 
начально обратимся к вопросу о влиянии на точность результата погрешно- 
сти исходных данных. В данном случае необходимо ответить на вопрос: "Как 
погрешность в задании элементов матрицы А влияет на точность определе- 
ния собственных значений и собственных векторов?" 


2.5.1. Устойчивость проблемы собственных 
значений 


Ограничимся случаем, когда рассматриваемое собственное значение простое. 
Сохраняя обозначения из разд. 113.3, определим А, и ц, как собственные 


значения и собственные векторы матрицы А: 


Ац, =Ац,, (2.5.1) 
а у; как собственные векторы транспонированной матрицы А’: 


А’У.= Ау; или УГА = Ауу. (2.9.2) 
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Напомним, что в соответствии с внешним видом (2.5.1) и (2.5.2) и; часто 
называют правыми собственными векторами, а у, — левыми. Для этих век- 


торов, относящихся к различным собственным значениям, в разд. ПЗ.3 уста- 


новлено, что 


Уи, =0, ГА. (2.5.3) 


Если допустить небольшие изменения АА элементов матрицы, то изменения 
собственного значения ДА, и собственного вектора Ли, с точностью до 


элементов второго порядка малости будут удовлетворять линеаризованному 
уравнению: 
ААц, Е АЛи, = АЛ. „0, + А Ац. (2.5.4) 


Умножим уравнение (2.5.4) слева на у, 


у ААих + У Али, = ЛА уги +А УГА. (2.5.5) 
Первоначально полагая в (2.5.5) значение / = к, получим 
А уГш, = УГЛАщ + (УА Ау Аш; = ЛА, 


Т 
у; ААц 
АМ =. (2.5.6) 
У Цу 


Оценивая изменение собственного значения сверху, получаем 


256—7 


ЛА.» |. | 
ал, ЗАНЫ С, АА, С, „Ба 


219.7 
Ух О Ух Чл соѕ( Фу) ( 


где С, — так называемый коэффициент перекоса, а Фф, — угол между соб- 
ственными векторами у, и и, матрицы А. (Весьма полезно соотнести это 
выражение с содержанием положения 2 в разд. 2.1.) 


Пусть теперь в (2.5.5) значение / К.С учетом (2.5.3) имеем 
У ГАА, 
(А —^,) 


Разложим погрешность собственного вектора Ди, по системе векторов и ;: 


у ААщ = (А, —Л ‚уг Ащ, У Лиу = 


) (2.5.8) 


т 
Ац; = 2, оу (2.5.9) 
Ј= 


4 Зак. 3418 
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Так как вектор и, + Ди, определяется с точностью до постоянного множите- 
ля, выберем этот множитель так, чтобы диагональный элемент разложения 
оу обратился в нуль (о, =0). Тогда, подставляя (2.5.9) в (2.5.8), с учетом 


(2.5.3) для о; получаем: 


у С: (2.5.10) 


После подстановки (2.5.10) в (2.5.9) вектор погрешности собственного векто- 
ра может быть оценен сверху 


МА 
А АА 
лч, | [АА]. [+ | У. Я-А]. Я Ј 
ИЛИ 
Ач, | А 
[вх | = |84]. т | (2.5.11) 


Неравенства (2.5.7) и (2.5.11) позволяют сделать следующие выводы. Чтобы 
изменение собственного значения было соизмеримо с величиной | 


чающий ему коэффициент перекоса должен быть не слишком велик. Так для 
симметрической матрицы, когда векторы ц, и у, совпадают и С, =1, нера- 


венство (2.5.7) приобретает весьма простой вид: 
Аж | АА. 


Изменение собственного вектора аналогичным образом зависит уже от всех 
коэффициентов перекоса. При этом легко заметить, что, даже если А, — 
простое собственное значение, наличие близких к нему собственных значе- 


ний из-за малой величины А, – А | может существенно повлиять на измене- 


ние |А. 


2.5.2. Частичная проблема собственных значений. 
Степенной метод 


Степенной метод (или прямые итерации) предназначен для нахождения 
максимального по модулю собственного значения и соответствующего соб- 
ственного вектора. Идея, лежащая в основе этого метода, широко использу- 
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ется и в других более эффективных алгоритмах. Пусть все собственные зна- 
чения Л, матрицы А различны и упорядочены следующим образом: 


> [^2| > [> а|>...> и. 


Зададимся некоторым начальным вектором хо, который разложим по собст- 


венным векторам и, матрицы А: 
Хо = 014] + 9545 +... 0 „Ч, (2.5.12) 


предполагая, что оу #0. Так как собственные векторы определяются с точ- 
ностью до постоянного множителя, все коэффициенты о, в (2.5.12) можно 
принять единичными. Однако для удобства мы сохраним приведенный вид 
этой формулы. 

В ходе применения степенного метода строится последовательность векторов 
х: 


Хр] = Ах,, (2.5.13) 


Хур = Ах, =) +о,Аќш, +... +о„Аки, = 


К К 


= ощ + 0, > Ц) +...+ 0, Га Ц 


| | 


т 


Для наименьшего угла ф между векторами х, и и; получаем: 


(хеш) 


| те (А, ГА у (>, м) )+...+ (^„ ГА у’ (и, ) 
оф = е ——————————— 


ый ә (а) ао (А, РА) 


т 


Так как [А, /А|<1, соѕф 1 при Ё о. Иными словами, вектор х; схо- 


дится к вектору щі, отвечающему собственному значению Ау. При больших 
значениях А имеет место приближенное равенство 


Хо РА = МХ. (2.5.14) 


Это позволяет вычислять приближенно А; как отношение каких-либо ком- 
понентов векторов х; И ху 
(7) 
А. а х 
с 
х 
р 
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“ип —————————————————————————————————————————————————— 


или как частное 


(хра) 
М, 2.5.15 
| (х,,Ь) ( ) 


где Ь — произвольный вектор. В частности, в роли Б может использоваться хх: 


а (кено). 
(ххх) 


При |^\|<1 последовательность х, сходится к нулю, а при А >1 она неог- 


раниченно возрастает. Поэтому целесообразно нормировать вектор х; на 
Ы 

каждой итерации. В итоге рабочие формулы (2.5.13) и (2.5.15) дополняются 

условием нормировки, и на (4 + 1 )-м шаге используется вектор х, Ах, |. 


Если начальное приближение хо выбрано неудачно, так, что о; = 0, то тео- 
ретически итерационный процесс должен сходиться к А, . Однако на практи- 
ке нередко наблюдается следующий эффект. Сначала процесс начинает схо- 
диться к А,, а затем все же сходится к Ау. Связано это с тем, что из-за 
ошибок округлений в разложении х; по собственным векторам возникает 
ненулевой коэффициент оц. Слагаемое, относящееся к щі, сначала очень 
малое, начинает заметно расти с ростом К. 

Следует отметить, что рассмотренная идея легко распространяется на случай, 
когда максимальное по модулю собственное значение является комплексным 


или кратным. Имеется также модификация, позволяющая найти одновременно 
сразу группу собственных значений, превышающих остальные по модулю. 


Обратный степенной метод (или обратные итерации) сводится к степенно- 


му методу, примененному к обратной матрице А-'. Рабочие формулы метода 
имеют вид: 


Ах. = Ху, (2.5.16) 
(х,.Ы) 

ТА (2.5.17) 

к (хил, Б) 


Максимальное по модулю собственное значение матрицы А”! равно (1 1А ). 
Аналогично предыдущему 


и Е ] ] 
хр = А А ХА = | —— Цр Хр, (2.5.18) 
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откуда и следует (2.5.17). Если скорость сходимости прямых итераций опре- 
‚ то в случае обратных итераций эта скорость за- 


деляется величиной А ГА 


В поиске обратной матрицы нет необходимости, доста- 


ВИСИТ от А. ГА 


точно на каждом шаге решать линейную систему (2.5.16). Трудоемкость 
расчетов резко снижается, если однократно определять 10-разложение мат- 
рицы А (например, программой ресомр), а затем на каждой итерации решать 
две системы с треугольными матрицами (например, программой ѕоІук). Как 
и для прямых итераций, рабочие формулы (2.5.16) и (2.5.17) необходимо до- 


полнить условиями нормировки и использовать вектор х, / |х, |. 


Метод обратных итераций может быть распространен и на случай поиска 
собственного значения, ближайшего к некоторой величине и. В этом случае 


он называется обратный степенной метод со сдвигом (или метод Виландта). 
Очень часто он используется, когда собственное значение А, уже найдено с 


некоторой погрешностью, и требуется лишь уточнить Л, и найти соответст- 


вующий собственный вектор. В этом случае вместо (2.5.16) предлагается ис- 
пользовать следующую формулу: 


(А – рЕ)х, = Ху. (2.5.19) 


Легко заметить, что собственное значение, ближайшее к и, является мини- 
мальным по модулю собственным значением матрицы А – ЦЕ. Здесь также 


принято сокращать объем вычислений однократным предварительным при- 
ведением исходной матрицы А к одной из специальных форм (трехдиаго- 
нальной, хессенберговой и т. п.), сокращающей решение (2.5.19) на каждой 
итерации. Сдвиг иногда изменяется на каждом шаге: 


(А-шЕ) ху = ху. (2.5.20) 


В роли и, для ускорения сходимости может быть использовано очередное 


приближение к искомому собственному значению. В такой ситуации необхо- 
димо лишь учитывать, что матрица системы становится очень плохо обу- 
словленной. 


2.5.3. Полная проблема собственных значений. 
ОК-алгоритм 


ОК-алгоритм является самым популярным современным алгоритмом для ре- 
шения полной проблемы собственных значений (нахождения всех собствен- 
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ных значений матрицы). Его авторами являются В. Н. Кублановская и 
Дж. Френсис (Егапсіѕ Ј. С. Е). До изложения основных формул выполним не- 
которую подготовительную работу. 


Определение. Квадратная матрица называется матрицей Хессенберга, если 
ее элементы а; равны нулю для і> & +1. 


Матрица Хессенберга имеет "почти треугольный" вид: 


ж ж ж * ж ж 


ж ж ж ж ж ж 


о * * ж ж ж 
00 * * ж ж 
оо ж ж ж 
0 9 Р 


Иными словами, это верхняя треугольная матрица и еще одна поддиагональ. 
Остальные элементы равны нулю. Здесь и в дальнейшем символом "*" обо- 
значаются элементы матрицы, которые в общем случае отличны от нуля. 


Определение. Преобразованием Хаусхолдера называется преобразование со 
следующей матрицей 


уу/ 


е. 
М 


где у — вектор, порождающий преобразование. Его часто нормируют и ис- 
пользуют вектор единичной длины: и=у/ МІ ‚ Тогда матрица Н приобрета- 


ет вид: 


Н =Е-2 (2.5.21) 


Н =Е 200и”, || =1. (2.5.22) 


Здесь везде и в дальнейшем используется сферическая норма вектора 


|у? = ци = (м, и). 


Свойства преобразования Хаусхолдера 
1. Матрица преобразования Хаусхолдера является симметрической. 


НГ -Е-200/ ЕН. 
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2. Матрица преобразования Хаусхолдера является ортогональной, т.е. 
Н/Н=Е. 


Н”н = Н? = (Е-2щи” )(Е-2щи7 )= Е -4ии” + 4щи' ши" = Е. 
3. Пусть е, — К-й столбец матрицы Е, у =х + |х] ‚е,. Тогда Нх = |х| е. 


Доказательство. 


Т | Е 
Уу Хх х= (ие, 2 (+ е) х 
(х |х|) -(х+ [9-е ) 


7 == 
М 
2(х +|к|-е,) х 
(к) а 
хх + |х| хе + |х|-есх |х| ее 


Нх = Ех – 2 


2р +214. 


= в. 
2] +21 х 


(кер) 


Произвольная квадратная матрица может быть приведена к форме Хессен- 
берга с помощью преобразования подобия Хаусхолдера, сохраняющего соб- 
ственные значения исходной матрицы. 

Пусть исходная матрица А имеет размер тх т. Выберем в качестве вектора 


х; первый столбец матрицы А без первого элемента: хү = (5 аара) 


Сформируем вектор у; = ҳу + |х, |-е, и на его основе построим матрицу Хаус- 
холдера Н,. Векторы ху, у}, е имеют размер т –1, а матрица Н; — раз- 
мер (т 1) х(т – 1) соответственно. Уже на основе Н, определим ортого- 
нальную матрицу О; размера тхт, первая строка и первый столбец 
которой совпадают с единичной матрицей Е, а остальные элементы равны 


элементам Н: 


[00.0 
он, 
и =| 0 =01=07. 
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После умножения матрицы А слева на (О, в силу свойства 3 первый столбец 


приобретает вид столбца матрицы Хессенберга: 


а ж ж ж 
– |х; | ж Ж ж 

ОА =| 0 Т а" 
0 ж ж ж 


а умножение результата на О, справа не изменяет структуры первого столб- 


ца. Таким образом, после первого шага от матрицы А переходим к подобной 
матрице А = О;АО, с нужным видом первого столбца и теми же собствен- 


ными значениями. 


Второй шаг выглядит аналогично. Сначала строим вектор х, размера т-2, 


как второй столбец матрицы А, без первых двух элементов, и вектор у, : 


* 


* * ү 
Хх) = (3, а42› ..-› аһ) ‚ Уз =Х› + |х, |-е. 


Здесь вектор еј — по-прежнему первый столбец единичной матрицы Е, но 
уже размера т-2. На основе у, получаем матрицу Хаусхолдера Н, раз- 
мера (т-2)х(т-2). Аналогично предыдущему шагу определим ортого- 
нальную матрицу 0, размера тхт, первые две строки и два столбца ко- 
торой совпадают с единичной матрицей Е, а остальные элементы равны 
элементам Н, : 


оо 0 
ого 0 
0, = Н, = 105! = 0) 
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Подобное преобразование с этой матрицей позволяет получить матрицу 
А, = О,АО,, первые два столбца которой имеют вид столбцов матрицы 
Хессенберга: 


Аз = О,А 0, = О, (ШАО) = 


Продолжение этого процесса позволяет за т – 2 шага получить матрицу А, 
имеющую форму Хессенберга и сохраняющую те же собственные значения, 
что и исходная матрица А: 


А — (0203.-050, ЈА(0,0,...0,„ 30,2 ) — $ 1А$ = ЅТА$Ѕ, 
МҸ =010....9 „39-2. 


Легко заметить, что если матрица А была симметрической, то это свойство 
сохраняется иу А , т. е. она оказывается трехдиагональной. 


Преобразование Хаусхолдера не является единственным способом, приводя- 
щим матрицу к форме Хессенберга. Этой же цели можно достигнуть, напри- 
мер, с помощью преобразования Гивенса. 


Определение. Преобразованием Гивенса называется преобразование с мат- 
рицей (2.5.23), называемой также матрицей вращения. Эта матрица отлича- 
ется от единичной Е только четырьмя элементами, стоящими на пересече- 
нии двух строк и двух столбцов с номерами А и /: 


А с сле 2 Р 
Гк = 1 р = С; Гк = = 5; Ср 1: 


Непосредственным перемножением убеждаемся, что матрица вращения яв- 
ляется ортогональной: 


ЕТ ТР 
Те = Тр; Ту Ту =Е. 
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Ту = с | | (2.5.23) 


] 


Обозначим за А(;) й столбец матрицы А, а за А“) кю строку этой мат- 
рицы и умножим А на Ту, (В=АТ,,). Матрицы А и В отличаются лишь 


двумя столбцами: 


В) СА +5А( р); Вс) =-5А(у СА р. (2.5.24) 


Теперь матрицу Т; умножим на В (с =т/В). Матрицы С и В, в свою оче- 
редь, отличаются лишь двумя строками: 


С = св® + 5В0; С = -5В( +В). (2.5.25) 


Т 
Таким образом, в матрице С = Т, АТ», по сравнению с А изменяются лишь 
две строки и два столбца с номерами К и /. Обозначим элементы матрицы С 
как 2 „;. Принимая во всех дальнейших рассуждениях 1 < / <, выберем сво- 


бодные параметры с и $ так, чтобы 8; ; = 0. 


ВЕСЬ, ул +56, ур = Сар рр + 8а р. 


Последнее равенство очевидно, т. к. столбец с номером /-1 в матрицах В и 
А один и тот же. Выполняя требование $; ;_ = 0, получаем следующие вы- 


ражения для си $: 


а Ис ОНИЕ Ч), )-1 
==  5= ан 00) 


и 2 2 


С а 
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Проводя последовательно подобные преобразования с матрицами Т,,, 
Тат 


„2› обеспечиваем вид первого столбца, как у матрицы Хессенберга. 


Желаемая форма второго столбца достигается использованием матриц Таз, 


Т Т (т 2)(т – 1) 
535 .--> О 


из ИТ. Д. Выполнив суммарно 


аналогичных преобра- 


зований, получаем матрицу в форме Хессенберга. Легко убедиться в том, что 
каждое последующее преобразование сохраняет ранее полученные нулевые 
элементы. Хотя для достижения результата количество требуемых преобра- 
зований Гивенса заметно больше числа преобразований Хаусхолдера, вычис- 
ления по формулам (2.5.24) —{(2.5.26) сводятся всего лишь к изменению двух 
строк и столбцов. 


Теперь обратимся к построению ОК-разложения матрицы. 


Определение. ОК-разложением матрицы А называется ее представление 
в виде А = ©К, где О — ортогональная, а В — верхняя треугольная 
матрицы. 

ОК-разложение матрицы может быть построено различными способами, на- 
пример, на основе преобразований Хаусхолдера. При этом план построения 
весьма похож на процедуру приведения матрицы к форме Хессенберга. 


Пусть исходная матрица А имеет размер тх т. Выберем в качестве вектора 


х; первый столбец матрицы А : х; ты 


Сформируем вектор у; = ху +|х|-е| и на его основе построим матрицу Хаус- 
холдера Н;. Векторы х}, У, е имеют размер т, а матрица Ну — размер 
тхт соответственно. На основе Н; определим ортогональную матрицу 
О, = НҢ; и умножим матрицу А слева на О. Первый столбец получившейся 


матрицы в соответствии со свойством 3 преобразования Хаусхолдера приоб- 
ретает вид первого столбца верхней треугольной матрицы: 


ж 


ж 


ж ж 


[к | * 
0 ж 


ОА =| 0 ж ж ж 
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На втором шаге сначала строим вектор х, размера т-1, как второй столбец 
матрицы ОА без первого элемента, и вектор у, : 


р = (25), 43), -., аһ), О ТАХ + [к |-е. 
Здесь вектор еј по-прежнему первый столбец единичной матрицы Е, но уже 
размера т-1. На основе у, получаем матрицу Хаусхолдера Н, размера 
(т-–1)х(т-1). Аналогично предыдущему шагу определим ортогональную 
матрицу О, размера тх т, первые строка и столбец которой совпадают с 


единичной матрицей Е, а остальные элементы равны элементам Н, : 


1 о0о. 0 


Умножая матрицу ОА справа на О,, обеспечиваем уже два столбца верх- 
ней треугольной матрицы: 


ж 
ж 
ж 
* 
х 
ж 


о © о 
% 
ж 
% 
* 


0 0 * * * * 


Продолжение этого процесса позволяет за т – 1 шаг получить верхнюю тре- 
угольную матрицу В: 


(9„Ож-2..99)А=В; А=ОВ; 


© =(0,„ 10, 2..10,0,) =(0,„ 10, 2.100) =00,..20, 50,1. 


Ортогональность матрицы © непосредственно следует из симметричности и 


ортогональности матриц О,. 


Приступим к изложению ОК-алгоритма решения полной проблемы собст- 
венных значений. 
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ОК-алгоритм 


Грубая схема алгоритма выглядит следующим образом. Обозначим А = А. 
На шаге с номером & выполняется ОК-разложение матрицы А’. Затем мат- 
рицы О; и К, перемножаются в обратном порядке для получения А, |. 
При этом матрицы А; и А, оказываются подобными, т. е. собственные 
значения исходной матрицы в результате такого преобразования сохраняются. 


А; =О,Вх; А =В,0,; А =ОгГА,О, = ОА, Ор. (2.5.27) 


Пусть первоначально собственные значения матрицы А различны. Тогда, 
как это было показано авторами метода, с ростом числа шагов сумма моду- 
лей элементов А,, расположенных ниже главной диагонали, убывает и в 


пределе при К — о стремится к нулю. Матрица А, становится в пределе 


верхней треугольной, а ее диагональные элементы стремятся к собственным 
значениям исходной матрицы. Если среди собственных значений А есть 
комплексно-сопряженные или кратные, то А, в пределе становится блочной 


квазитреугольной: 
А} А}; А; > Ауу 
А, > 
0 0 0 хо Ам 
Здесь А; — квадратные подматрицы (матричные клетки), а А, =0 для всех 


Г > ј. Собственные значения А, исходной матрицы А определяются собст- 
венными значениями всех диагональных клеток. Если вещественные А, не 


являются кратными, то им отвечают диагональные клетки первого порядка 
1х1. Комплексно-сопряженной паре А, у отвечает диагональная клетка 


2х2, а если А, имеет кратность 5, то соответствующий размер 5х5 имеет 
и диагональная клетка. 


Непосредственная реализация ОК-алгоритма в форме (2.5.27) сталкивается с 
целым рядом затруднений. С одной стороны, алгоритм сходится относитель- 
но медленно, а с другой стороны, на каждом шаге необходимо осуществлять 
трудоемкую операцию ОК-разложения и последующее умножение матриц. 
Сокращение объема вычислений при реализации алгоритма на практике реа- 
лизуется двумя путями: уменьшением количества итераций, т. е. повышени- 
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ем скорости сходимости, и снижением трудоемкости одного шага. В первом 
случае используется алгоритм со сдвигами, а во втором случае матрица пред- 
варительно приводится к форме Хессенберга. 


Алгоритм со сдвигами 


Как и в случае обратного степенного метода, использование сдвигов заметно 
повышает скорость сходимости. Если известно приближение т, к некоторо- 


му собственному значению матрицы А, то рабочие формулы алгоритма со 
сдвигами приобретают следующий вид: 


А -тЕ=О,В;; Ад = КО + Е. (2.5.28) 
Нетрудно заметить, что каждая итерация по-прежнему сохраняет собствен- 
ные значения матрицы (Анн =ОГА, О, = ОТА О, ). Существует несколько 


стратегий сдвига, многие из которых практически безупречно работают на прак- 
тике в течение многих лет, но глобальная сходимость для них не установлена. 


Предварительное приведение матрицы 
к форме Хессенберга 


Для снижения объема вычислений исходная матрица Ау = А размера тх т 


предварительно однократно приводится к форме Хессенберга, что значи- 
тельно снижает трудоемкость итерации ОК-алгоритма. Если в случае матри- 
цы общего вида количество операций умножения и сложения для реализации 


одного шага по формулам (2.5.27) пропорционально кубу размера (- т? ), то 
для матрицы Хессенберга это число пропорционально всего лишь квадрату 
размера (- п). Решающим фактором является то, что последующие шаги 
алгоритма сохраняют форму Хессенберга для А,. Покажем справедливость 
этого утверждения. 
Пусть матрица Ау имеет форму Хессенберга: 

+ ж жж 

* ж ж ж 


ее | 


о 
Ф 
% 
к 
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Тогда Фо = АВ; также имеет такой же вид, в чем легко убедиться непо- 
средственным умножением: 


ж жж Ж /ж*х жж ж ж жж ж 

жх жж О ж жж ж ж ж ж 
Оо = АК = ж ж ж. 0 Т а о * * * 
00 * */ 10 0 + 00 * * 


Теперь, перемножая Оу и К, в обратном порядке, убеждаемся в том, что А | 


сохраняет форму А: 


ж жж Ж хх жож ж ж ж ж ж 

о * * *| |ж ж ж ж ж ж ж ж 

А; = КО, 0 ж жі о * * ж* Е о * * *[ 
о0о +10 0 * * 00 * * 


Ранее были рассмотрены лишь основные этапы ОК-алгоритма. Его реализа- 
ция на практике сопровождается еще целым рядом важных деталей. Так, на- 
пример, для уменьшения относительной погрешности результатов исходная 
матрица подвергается процедуре уравновешивания (или так называемой ба- 
лансировки), уменьшающей норму матрицы А , ит. п. 


Высокая популярность ОК-алгоритма на практике связана не только с его 
надежностью и высокой вычислительной эффективностью. Важную роль иг- 
рает тот факт, что подобные преобразования осуществляются с ортогональ- 
ными матрицами. Предположим, что на шаге с номером А+| 


(А. =ОГА, О, = ГА: О, ) элементы матрицы А, задавались с погреш- 


ностью АДА, . Тогда, оценивая погрешность ЛА, ‚у по норме, получаем: 
Ах ДАр = Ох (Ах +АА, )О; = Ау + АДА, ОХ, 
лаа = ГАА, [л |< 04| ОДА, |= соо, [АА | 


Если в качестве нормы выбрана спектральная норма, то для ортогональной 
матрицы ©, число обусловленности сопд(@,)=1, что и определяет мини- 


мальное влияние погрешности предыдущего шага. 


ГЛАВА 3 


Решение нелинейных уравнений 
и систем 


Большинство методов, предназначенных для нахождения корней нелинейно- 
го уравнения 


Јох) =0 (3.0.1) 


предполагает, что заранее определены некоторые промежутки, где это урав- 
нение имеет только один корень. Поэтому задаче нахождения решения (3.0.1) 
с заданной точностью предшествует этап отделения корней, связанный с ис- 
следованием количества, характера расположения корней и нахождением их 
грубого приближения. Уравнение (3.0.1) может вообще не иметь решений, а 
может встретиться ситуация (например, уравнение х=12(х)), когда число 


корней бесконечно. Этот этап формализуется лишь частично и чаще относит- 
ся к области математического искусства. Универсального эффективного ме- 
тода в общем случае нет. На практике в большинстве случаев ограничивают- 
ся приближенным построением графика у = /(х) или составлением таблицы 


для (х) с некоторым шагом и нахождением участков, где функция меняет 


знак. При этом шаг не должен быть слишком крупным (должна быть уверен- 
ность в не более, чем одном нуле между узлами), а с другой стороны, он не 
должен быть излишне мал (иначе резко возрастает объем вычислений). 


Иногда уравнение (3.0.1) удобно преобразовать к виду 

ф(х) = щ(х), 
а затем искать точку пересечения графиков у = ф(х) и у= (х), что и будет 
начальным приближением. 


Из нелинейных уравнений общего вида (3.0.1) часто выделяют алгебраиче- 
ские, специфические свойства которых можно использовать при решении. 
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3.1. Уточнение корней 
одного уравнения 


* 
В рамках раздела будем использовать следующие обозначения: х = х, +Е,, 


ж 
где х — точное решение (3.0.1), х, — очередное приближение к решению, 


=, — погрешность. 


п 


Остановимся лишь на вещественных корнях уравнения (3.0.1), считая, что 
функция /(х) нужное число раз непрерывно дифференцируема для выбран- 


ного метода и установлен промежуток [а, Ь], где находится единственный 
корень. При этом Х(а): (Б) <0. Тогда наиболее простым и абсолютно на- 


дежным способом является метод бисекции (или метод дихотомии, или ме- 
тод половинного деления). Его алгоритм представим следующим образом: 


1. Вычислить (а) и (Р). 

2. Положить с = (а + Б)/2 и вычислить (с). 

3. Если ѕівп(/(а)) = ѕ510п(/(с)), заменить а на с. Иначе заменить Ё на с. 

4. Если |Б – а > =, то перейти к шагу 2. Иначе закончить вычисления. 

Одна итерация алгоритма позволяет гарантированно сократить исходный 


промежуток в два раза независимо от вида функции. 


ВОПРОС 13 


Это свойство метода является его достоинством или недостатком? 


Например, для уточнения трех десятичных цифр требуется 10 итераций 
(210 =1024 =103). 
Количество чисел, представимых в компьютере, конечно, и в нем может не 


существовать числа, обеспечивающего строго точное равенство в уравнении 
(3.0.1). Поэтому минимальная длина промежутка, где /(х) меняет знак, ог- 


раничена снизу дискретностью представления чисел в компьютере. 
Другой алгоритм, называемый методом секущих (рис. 3.1), можно построить, 
используя интерполяционный полином Лагранжа первой степени для / (х) 


по двум узлам а и 6. 
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Тогда нуль этого полинома принимается в качестве очередного приближения 
к корню уравнения (3.0.1). 


х- Б х-а ЕЕ га 
а е трае До с=а тву уа)! © 
4 
УФ) 

2 

С 

0 

Е 

и: 

_3 5 

0 02 04 06 08 1 12 14 16 18 2 


Рис. 3.1. Метод секущих 


Новый промежуток будет [с, В] или [а, с| в зависимости от знака /(х) в 


точке с. На рис. 3.1 это будет [с, Ь]. Скорость сходимости метода секущих 


А 1.618 
5-а 


<|х —х, Следует отметить, что 


ж 
определяется неравенством іх — Хун] 


замедление сходимости этого алгоритма часто наблюдается, когда очередное 
приближение получается слишком близко к одному из концов промежутка. 


Если функция вычислена более, чем в двух точках, то эта информация может 
быть использована в дальнейшем. Так, в методе обратной квадратичной 
интерполяции строится интерполяционный полином второй степени по трем 
точкам х,, хур, Хо для обратной функции с выполнением условий 
х= 2(3), і= к, К-1 Е-2. В качестве следующего приближения берется 


хр = (0). Одна из предыдущих точек удаляется. Важно, чтобы три значе- 
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ния } были бы различными, тогда исключается деление на ноль, и сходи- 


7 ВИ 


<|х - х 


ж 
мость метода определяется неравенством |х — Хр 


Сочетание методов бисекции и обратной квадратичной интерполяции реали- 
зовано в процедуре-функции 2ЕВОТМ(А, В, Е, ЕРЗ) [14]. Здесь ди в — кон- 
цы интервала, где ищется корень; г — имя процедуры-функции, имеющей 
лишь один аргумент, для которого вычисляется /(х), ЕРЗ — граница по- 


грешности, допустимой в результате. 


Основным алгоритмом является метод обратной квадратичной интерполяции 
(если х;, хрр, хр ә не являются различными, то используется метод секу- 


щих). Если очередное приближение получается слишком близким к одному 
из краев промежутка, то осуществляется переключение на метод бисекции. 


Еще одним методом для решения (3.0.1) является метод простой итерации, 
для построения которого эквивалентными преобразованиями приведем 
(3.0.1) квиду 


х = ф(х), (3.1.1) 


где корень х’ уравнения (3.1.1) является корнем и (3.0.1). Вместо уравнения 
(3.1.1) предлагается решать разностное уравнение 


хи+1 = Ф(х,) (3.1.2) 
пошаговым методом. Для оценки сходимости запишем равенство (3.1.1) в 


* 
точке х и вычтем из него равенство (3.1.2): 


ж ж 
Еһ =Х — хин = Ф(х ) – Ф(х,) = Ф(х, +Е,) – Ф(х,). 
Раскладывая ф(х, +=„) в ряд по степеням &, и ограничиваясь в остаточном 
члене первой производной, получаем уравнение погрешности: 
Еп = Ф(х, +Е,) — Ф(х,) = Ф(х,) + =„Ф'(п) –Ф(х,) = „Ф (1). 


Отсюда непосредственно следует, что для убывания погрешности необходи- 
мо потребовать выполнение условия 


Іф'(т)| < 1. (3.1.3) 


Искусство пользователя, таким образом, заключается в приведении уравне- 
ния (3.0.1) к виду (3.1.1) так, чтобы имело место неравенство (3.1.3). При 
этом чем меньше по модулю значение производной, тем быстрее достигается 
желаемая точность. 
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Высокой скоростью сходимости в ряде случаев обладает метод Ньютона 


ж 
(или метод касательных). Подставляя в уравнение (3.0.1) его корень х и 
раскладывая в ряд по степеням є, 


2 
е ' 6 п 
О= у(х ) = ЛО, +) = ЛО) О) 0), (3.1.4) 
пренебрежем последним слагаемым в (3.1.4) и для є, получим 


ПИЕ 7) 
ДИГ 


Тогда рабочая формула метода Ньютона приобретает вид: 


_ Ло) 
И ' И 
Л (х) 
В отличие от методов бисекции, секущих и обратной квадратичной интерпо- 
ляции сходимость (3.1.5) обеспечивается далеко не всегда. В перечне доста- 


точных условий сходимости фигурирует не только существование ненулевой 
производной /"(х) в точках х,, но и ее знакопостоянство. Если, тем не ме- 


Хп = 


(3.1.5) 


нее, методу Ньютона обеспечено хорошее начальное приближение, то в 
дальнейшем убывание погрешности носит квадратичный характер. Для дока- 


ж ж 
зательства этого факта из очевидного равенства х = х вычтем уравнение 
(3.1.5): 


п) Ло) жЕ, (х) 


5+1 = Р Б Я 3.1.6 
ШУУ н. 
Упрощая числитель (3.1.6) с помощью равенства (3.1.4), получаем 
вин = ар Ет 
23 (х) 
7" (п) 

Е,.11< Се?, –————| < С. 

ин < Сел ДРЕ (3.1.7) 


Метод Ньютона называют еще методом касательных, т. к. формула (3.1.5) 
получается на основе уравнения касательной 


у= О(х) = (х) + (х, хи). 


Корень этого полинома отвечает следующему приближению х,.. 
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Для расширения области сходимости можно использовать метод Ньютона с 
регулировкой шага: 


Ло») 
Ро) 


ж 
Первоначально, когда начальное приближение ху еще далеко от х , пара- 


Хи = Хи — ‚ О<а, =1. (3.1.8) 


метр о, выбирают меньше | (часто на практике это примерно 1/3), а по мере 


ж 
приближения х, к х значение а, —1, превращая (3.1.8) в обычный метод 


Ньютона. В некоторых случаях это позволяет расширить область сходимости 
метода Ньютона. 


Широкое распространение получил и модифицированный метод Ньютона с 
постоянным значением производной: 


(х) 
п 
Хи-+1 — Хп = ' ; 

Л (хо) 
Сходимость В этом случае несколько замедляется, но заметно уменьшается 


трудоемкость отдельной итерации, не требующей теперь вычисления произ- 
ВОДНОЙ. 


(3.1.9) 


3.2. Метод Ньютона для систем уравнений 


Решение систем нелинейных уравнений доставляет очень большие трудно- 
сти, т. к. нет универсальных алгоритмов решения этих задач, особенно для 
больших т. 


Достоинством метода Ньютона по сравнению со многими алгоритмами пре- 
дыдущего раздела является то, что он обобщается на системы уравнений. 
С этой целью обратимся к уравнению (3.0.1), полагая х и Ё векторами 


х=(х9, ХО), х) ), А = (2, <, ВО ). 


Формула, являющаяся аналогом (3.1.5), может быть получена таким же обра- 
зом, как и для скалярного случая, на основе разложения типа (3.1.4). При 
этом =, представляет собой вектор, и разложение в ряд необходимо прово- 


дить по всем компонентам этого вектора для Ё, как функции многих пере- 


менных. В настоящем разделе используем другой подход, основанный на 
лемме Адамара. 
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Рассмотрим вектор-функцию Ё(х+1:=„) скалярного аргумента /. При этом 
величина &, считается не зависящей от /. Вычислим производную этой 
функции по # и проинтегрируем результат по Е от 0 до 1. 


а 
(хае) = ии 
т. ( Е,) 


І Й 
НЫ +1 &„) р? 


И? 


Акра) = 
04 0 


(х+е,) (х) = аа я (3.2.1) 


ж 
Полагая х = х, и по-прежнему считая величину х = х, + є, точным корнем 


уравнения (3.0.1), т. е. #(х, +, ) = (х) = 0, из (3.2.1) имеем: 


» 2. 
а (х, ). 


Вычисляя интеграл в последней формуле по квадратурной формуле левых 
прямоугольников, получаем метод Ньютона для систем уравнений в тради- 
ционной форме 


–1 
Ох 
Хех ыы (х,) (3.2.2) 
ИЛИ 
ОГ( хи} 
СА (жи) = Ух). 23) 
Представление метода в виде (3.2.3) позволяет уменьшить вычислительные 
0х, ) 


затраты, поскольку не требует обращения матрицы Якоби ЕЕЕ. а сводит- 


ся к решению линейной алгебраической системы на каждом шаге итерацион- 
ного процесса. Как и в скалярном случае, в достаточно малой окрестности 
корня итерации сходятся и скорость сходимости квадратичная. Значительно 
уменьшается объем вычислений в модифицированном варианте метода Нью- 
тона (формула (3.1.9) является его скалярным вариантом), когда матрица 
Якоби вычисляется однократно, раскладывается в произведение треугольных 
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матриц программой ресомр, а затем для получения очередного приближения 
используется только программа $01%Е. 


Для решения систем уравнений может быть использован и метод простой 
итерации. Формула (3.1.2) сохраняет прежний вид, только х и ф(х) являют- 


ся векторами. Достаточным условием сходимости является выполнение не- 


2ф <1, где С — матрица Якоби. 
дх дх 


равенства 


Подведем некоторые итоги. Для скалярного уравнения (3.0.1) только в рам- 
ках разо. 3.1 были рассмотрены пять методов, каждый из которых имеет свои 
сильные стороны. Методы бисекции, секущих, обратной квадратичной ин- 
терполяции весьма надежны и абсолютно застрахованы от неудачи. Метод 
Ньютона в окрестности нуля демонстрирует квадратичную скорость сходи- 
мости. Таким образом, пользователю предлагается широкий выбор алгорит- 
мов, и он может ориентироваться на специфику решаемой задачи. Иначе об- 
стоит дело при решении систем уравнений (3.0.1), когда Ё и х — векторы. 
Простейшие методы из перечисленных на системы уравнений впрямую не 
могут быть распространены, метод Ньютона требует хорошего начального 
приближения (а как его обеспечить?), а метод простой итерации требует 
предварительного преобразования системы (3.0.1) к виду (3.1.1) с выполне- 


29 


нием условия <1, что в общем случае весьма не тривиально. Все ска- 


занное требует серьезного усиления позиций алгоритмов для систем уравне- 
ний, в первую очередь, в направлении надежного получения решения. К этим 
проблемам мы вернемся в главе 6. 


3.3. Методы минимальных 
невязок Ракитского 


Решение систем нелинейных уравнений может быть построено на идее ми- 
нимизации некоторой функции подобно тому, как для линейных систем 
строился метод минимальных невязок (2.3.16)—(2.3.17). Так, для (3.0.1) 
Ю. В. Ракитским были предложены однопараметрический и трехпараметри- 
ческий методы минимальных невязок. Начнем с однопараметрического ме- 
тода, полагая, что # (х) — дважды дифференцируемая вектор-функция век- 
торного аргумента, отделение корней произведено, и начальное приближение 
хо находится в некоторой 7-окрестности корня: |х – хо <Р. 
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На первой итерации новое приближение находится по формуле 
Хх! = Хо + а(х). 
Учитывая (3.0.1), построим невязку в виде К(о) = (Ё(х,), Ё(х,)) и минимизи- 


ем ее по парамет Са. П и достаточно малых значениях |“ < азло- 
ру 0 0 р 


жим К(оо) в степенной ряд по степеням оц: 


2 
к(а) = К(0) +00700) + 22. А100) + О(о4). (3.3.1) 


Минимум обеспечивается условием А'(о) = 0, которое при пренебрежении 
в (3.3.1) слагаемыми с оу выше второй степени приводит к следующему 
требованию на а: 

К'(0) 


од = – "(0 (3.3.2) 


Если в частном случае система (3.0.1) является линейной, то #(х) является 


вектором невязки, и формула (3.3.2) переходит в выражение (2.3.17) метода 
минимальных невязок для систем (2.0.1). В нелинейном же случае значения 
К'(0) и К”(0) вычисляются по формулам численного дифференцирования. 


Выберем некоторое значение || < 5 и введем обозначения: А = А(0), 
К, = К(№у), К_ = К(-А). Тогда 


р: К, -2К+ В. 
4 2 


К'(0) = К"(0) = 


р. 


0 


и формула для о приобретает вид 


Последующие итерации выполняются аналогично: 
Хр = Ха +0 (х), (3.3.3) 


_ 0) №. КО) - КС) — 
0) 2 К) 2800) + АС№,). (3.3.4) 
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На каждом шаге вектор-функция #(х) вычисляется три раза, а условие ус- 
пешного выполнения итераций выглядит следующим образом: 


[|< о. 


Теперь обратимся к трехпараметрическому методу. По формулам однопара- 
метрического метода для выбранного начального приближения ху находим 


х(9) = Хо + оо (хо ). 
2ч (0) (0) 
Вычисляем оо, минимизируя невязку К(о) = (ех ), (хү ) 


Далее вычисляем 60х09) и строим вектор Р, = (хо) + Во (х(о), зависящий 


от параметра Ву, значение которого находим из условия ортогональности Р, 
и (ху): 


(Ро, хо) = (Ехо) + Вог(%® ) бко) |= 0; 
(ехо), (хо) 
фм 


Затем строим вектор хү по формуле ху = ху + ооЁй (хо) + УоРо, где параметр о 


0=- 


находим из условия минимума скалярного произведения: 
5(үо) = | (ху), (х; )) : 

Как и в однопараметрическом методе, раскладываем 5(у) в ряд и по условию 

$" (0) 

$" (0) 


емся формулами численного дифференцирования с шагом Ду: 1А] < 5) 


минимальности приходим к равенству Үү =- . Аналогично воспользу- 


0) 2 940) -250)+9С Ао) 


Последующие итерации выполняются в соответствии с равенствами 
0 0 0 
о = хр +9 (х), Ко) = (токо) ), хе ) 


(Л (к )- КСА) 


Решение нелинейных уравнений и систем 117 


Так завершается прогноз по однопараметрическому методу. Далее вычисле- 
ния проводятся по формулам: 


Р; = Г х) т Вх ) В; = Сы] та) 
Кэ К+] 


Хр = Хд +о (х) + үру; 
А 5(А,)-5(-А,) 
(ур) = (оно) 
(ур) = (Ор); Үк 2 5(А,)-25(0)+5(-А,) 


В трехпараметрическом методе шесть вычислений значений вектор-функции 
#(х) на каждой итерации: 


(хх), (хх +, )), Их; = РО, )), 
2х0), Ох + АЕ (ху), 60х00) А, (х, )). 


Условия успешного выполнения итераций: |е (х, „= (хе м) 


< |6(х,)|. Во- 


просы сходимости этих методов еще не в полной мере изучены. 


ГЛАВА 4 


Решение 
дифференциальных уравнений 


Как известно, в практических приложениях решения дифференциального 
уравнения или системы уравнений описывают динамику разнообразных яв- 
лений и процессов (например, движение совокупности взаимодействующих 
материальных точек, химическую кинетику, процессы в электрических цепях 
ит. п.). Однако интегрируемых в явном виде дифференциальных уравнений 
чрезвычайно мало. Поэтому столь важны численные методы. 


Задача Коши из множества решений для системы 


(Е) 
—^^=ф Г, х і Е 4.0.1 
_ (1,х(1)) (4.0.1) 
(1) (т) \! 
где { — независимая переменная, х(е) = ( Ре : ) — вектор искомых 


функций, удовлетворяющих уравнению, #(/, х) — вектор заданных, нужное 
число раз дифференцируемых функций, выделяет одно, проходящее через 
начальную точку (1, х). Аналогично ставится задача и для дифференциаль- 


ного уравнения 7-го порядка, разрешенного относительно старшей произ- 
водной, которое сводится к системе (4.0.1) из т уравнений первого порядка. 


Ф 
Если правые части Ѓ(/, х), а также элементы матрицы Якоби — непрерывны 


и ограничены в некоторой окрестности точки (1, хо), то задача Коши имеет 


единственное решение. Первоначально, исключительно для простоты рассу- 
ждений, будем полагать, что (4.0.1) представляет собой одно уравнение. 
Вместе с тем, абсолютно все излагаемые в данной главе методы сохраняют 
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свой внешний вид и для случая, когда х и Ё являются векторами и (4.0.1) 
является системой уравнений. 


Численное решение, получаемое любым способом, характеризуется двумя 
важными свойствами: устойчивостью и точностью. Определение устойчиво- 
сти, данное А. М. Ляпуновым (подробнее см. разд. 13.9), связано с качест- 
венным характером изменения решения при внесении в него возмущений. 
Точность же характеризует отличие приближенного решения от точного (ес- 
ли есть возможность получить или оценить последнее). 


Общий подход к решению (4.0.1) заключается в приближенном сведении 
дифференциального уравнения к некоторому разностному уравнению, кото- 
рое, в свою очередь, решается затем пошаговым методом. С этой целью вы- 
полним дискретизацию независимой переменной: /, = / + ил, где л — шаг 


интегрирования (шаг дискретности), а значения решения и его производной в 
этих точках кратко обозначим как х, = х(/,) и Ё, = (1, х,). Интегрируя 


(5.0.1) на промежутке [2,, г, |, получаем формулу 


Ч 
Хин =х, + | (т, х(т))ат, (4.0.2) 
[97 


которую можно считать базовой для построения большей части известных 
разностных схем. Различные методы при этом отличаются способом вычис- 
ления интеграла в равенстве (4.0.2). 


Использование квадратурных формул левых и правых прямоугольников, а 
также формулы трапеций, приводит, соответственно, к следующим числен- 
ным методам: 


Хи+1 = Хи + хи ) (4.0.3) 
Хин "Хи т ОИ ›Хи-+1 ), (4.0.4) 
ћ 
Хо = Хи + (Ии,хи)+ @ньхиы)), (4.0.5) 


которые получили название явного метода ломаных Эйлера, неявного мето- 
да ломаных Эйлера и неявного метода трапеции. Разностные уравнения 
(4.0.4) и (4.0.5) неявно задают значения х„. и требуют решения нелинейных 


уравнений на каждом шаге интегрирования. 
Каковы дальнейшие пути повышения точности? На первый взгляд, возможно 


использование более точных квадратурных формул, например, формулы 
Симпсона, других формул Ньютона — Котеса, Чебышева, Гаусса и др. Одна- 
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ко все они требуют вычисления подынтегральной функции в некоторых точ- 
ках внутри промежутка интегрирования, в то время как решение х(/) в этих 


точках нами не определено. Поэтому для решения задачи используются дру- 
гие подходы. 


4.1. Методы Адамса. 
Локальная и глобальная погрешности. 
Степень метода 


Первый подход предполагает для построения решения в точке {„.; использо- 
вание информации в ранее полученных точках /,, [,_, ... Так, по двум пре- 
дыдущим точкам /, и ѓ,_; построим интерполяционный полином первой сте- 


пени для функции #(/, х) 


е (т, х(т)) г Коа Е Р С 1а 


[и (1-1 [ии 


а 


и подставим его в формулу (4.0.2). Попутно заметим, что полином использу- 
ется вне промежутка интерполирования, т. е. проводится экстраполяция. По- 
лучаем следующий численный метод: 


р 
Хаа +5 (36, =). (4.1.1) 


Использование трех точек #„, 1, /,_> и полинома второй степени приведет 
к формуле 


й 
Хи] Хи + (234, —16 +52), (4.1.2) 
а для четырех точек разностная схема алгоритма приобретает вид 
Хи] Е Хи + (551, — 591 +371, – 93 ). (4.1.3) 


Все эти методы получили название методов Адамса. Они принадлежат се- 
мейству многошаговых алгоритмов, разностные уравнения которых имеют 
порядок выше первого. Методы (4.1.1)—(4.1.3) являются явными методами 
Адамса. Если в состав точек, по которым строится интерполяционный поли- 
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ном, ВКЛЮЧИТЬ {,.|, ТО возникают неявные методы Адамса. Для двух точек 
1+1, м Получается метод трапеций (4.0.5), а для трех точек {,.1, №, и 


четырех точек 1..1, {,, ѓу, 5 — следующие два метода: 


ћ 
Хи = Хх, + (вн + 81, Б Гы ), (4.1.4) 


А 
х ЕЖ += (9.1 +19, 5,1 + 6,5). (4.1.5) 


До изучения дальнейшего материала полезно попытаться ответить на сле- 
дующий вопрос. 


ВОПРОС 14 


Если в любой из формул (4.1.1)—(4.1.5) сложить все коэффициенты, 
стоящие при значениях #(/, х) в различных точках, то получается еди- 


ница. Случайно ли это? 


Несомненным достоинством явных методов Адамса является тот факт, что 
все они независимо от своей точности требуют лишь однократного вычисле- 
ния функции #(,х) на одном шаге, и конкурировать с ними в этом плане 


весьма трудно. Остальные значения производной решения берутся с преды- 
дущих шагов. Вместе с тем, методы Адамса, как и другие многошаговые ал- 
горитмы, не являются самостартующими, т. е. они требуют для начала интег- 
рирования специальных стартовых алгоритмов для расчета дополнительных 
начальных условий. В качестве этих стартовых методов может быть исполь- 
зован любой другой метод, например метод Рунге — Кутты, рассматривае- 
мый далее. Специфический способ представляют стартовые алгоритмы Ра- 
китского, имеющие асимптотический характер. В частности, для 
приведенных выше методов Адамса (вплоть до четвертой степени) достаточ- 
но вычислять начальные точки по формуле: 


Хх = Ху — АЙ, К = 1, 2, 95 


причем уже после нескольких первых шагов обеспечивается точность, адек- 
ватная степени выбранного метода. 


Неявные методы Адамса могут использоваться как сами по себе (тогда на 
каждом шаге решаются нелинейные уравнения относительно х, |), так и в 
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паре с явными методами. В последнем случае значение х, сначала оцени- 
Э 
вается явным методом (х? ). а затем уточняется неявным алгоритмом. На- 


пример, такую пару методов образуют методы (4.1.3) и (4.1.5) 


р 
хд =х, +54 (55% — 591,1 +371, 2-9, 3), (4.1.6) 


й Э 
хаа =, +5 (Е (иньжи +198, -5,1+0,2) (4.1.7) 


В зарубежной литературе совместное использование явного и неявного мето- 
дов называют методами прогноза — коррекции. В нашей литературе часто 
используют термин экстраполяционные методы для (4.1.6) и интерполяци- 
нонные методы для (4.1.7). Аналогичные пары методов образуют (4.1.1) и 
(4.0.5), (4.1.2) и (4.1.4). 


Теперь обратимся к анализу погрешности численных методов и начнем с са- 
мого простого алгоритма — явного метода ломаных Эйлера. Рассмотрим ча- 
стный случай формулы (4.0.3), когда функция #(/,х) не зависит от х. Тогда 


явный метод ломаных Эйлера превращается в квадратурную формулу левых 
прямоугольников: 


хан = Хи + ИР (1, ) = Хо +Й У Е. (4.1.8) 
к=0 


При этом общая погрешность в точке /, является точной суммой погрешно- 


стей, допущенных на каждом отдельном шаге. 


Иная ситуация складывается, когда {(/,х) зависит от х. Только погрешность 
первого шага формулы (4.0.3) при и = 0 вычисляется аналогично (4.1.8). Уже 
на втором шаге при и =1 эта погрешность сложным образом зависит от по- 
грешности первого шага, т. к. при вычислении #(4, ху) используется прибли- 
женное значение ху. В общем случае на м-м шаге погрешность очень сложно 


зависит от всех погрешностей, допущенных на предыдущих шагах. Разност- 
ное уравнение метода может оказаться неустойчивым, и тогда происходит 
неприемлемый рост погрешности. 


Устойчивость разностной схемы связана с выбранным методом, шагом ин- 
тегрирования и видом функции #(/,х). Важно так выбрать сам метод и шаг 


5 Зак. 3418 
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для него, чтобы погрешность решения была бы приемлемой. В соответствии 
со сказанным вводятся погрешности двух видов: 


О локальная погрешность — погрешность, допущенная на одном шаге при 
условии, что решение во всех предыдущих точках вычислено точно; 


П глобальная погрешность — разность между точным и приближенным 
решением на и-м шаге. 


Именно глобальная погрешность является истинной погрешностью. Ло- 
кальная погрешность совпадает с ней лишь на первом шаге. Однако в об- 
щем случае оценка глобальной погрешности крайне затруднена, а чаще не- 
возможна, и поэтому оценивают локальную погрешность на каждом шаге. 
Малая величина локальной погрешности вовсе не гарантирует малую вели- 
чину глобальной, но если есть уверенность, что устойчивость разностного 
уравнения метода обеспечена, то из малой величины локальной погрешно- 
сти следует, что глобальная не будет слишком велика. Будем пока пола- 
гать, что устойчивость обеспечена, и рассмотрим подробнее характеристи- 
ки локальной погрешности. 


Важной характеристикой является "степень" (или "порядок точности”) ме- 
тода. В дальнейшем будем употреблять термин "степень", чтобы не путать 
эту характеристику с порядком разностного уравнения метода. Все ранее 
рассмотренные методы могут быть записаны в следующем виде: 


Хи = Хи + ҺЕ (1,,А,х, ХХ >***> Хи-К ). (4.1 9) 


Разложим выражение в правой части равенства (4.1.9) в ряд Тейлора по сте- 
пеням А в точке /, 


4“х(1и) 
Е (4.1.10) 


о 
Хи! = х (1, р һ) = Хх, + уЗ об) 
к=] 

С другой стороны, значение х, | = х (1, +й) может быть представлено, в 

свою очередь, точным разложением в ряд 
со Я* 
Хи =х(!, +л) =х, ХЕ. н (4.1.11) 
Метод имеет степень (порядок точности) 5, если коэффициенты разложения 


(4.1.10) совпадают с соответствующими коэффициентами (4.1.11) до /* 
включительно. В качестве примера определим степень некоторых ранее по- 
лученных методов. 
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Для явного метода ломаных Эйлера, учитывая (4.0.1), имеем 
' 
х, = х, + ИЁ(Ё,х,)=х, + Ах (1,). 


Вычитая эту формулу из (4.1.11), видим, что совпадают коэффициенты лишь 


при й!, и для локальной погрешности этого метода первой степени справед- 


2 и 
| Ах (1) 
лива оценка: 5, -.| о Аналогично убеждаемся, что метод Адамса 


(4.1.1) имеет вторую степень (совпадают члены разложения при и А) 


ћ , , Г р? и" р? т 
ХЕХ +5 (3х (1) х1, =) = х, +йх () + х (0) 7х (1,)+..., 


а после вычитания этого выражения из (4.1.11) получаем оценку локальной 


З.т 
5х (1) 7 
погрешности: ғ, Ре Нетрудно убедиться, что неявный метод ло- 
маных Эйлера имеет первую степень, неявный метод трапеций — вторую, 
методы Адамса (4.1.2) и (4.1.4) — третью, а методы (4.1.3) и (4.1.5) — чет- 


вертую степень соответственно. Главный член погрешности метода 5-ой сте- 


+ 
пени содержит, как множитель, величину р | . 


В заключение данного раздела отметим любопытную ситуацию. И явный ме- 
тод ломаных Эйлера, и неявный являются методами первой степени и имеют 
локальную погрешность примерно одного порядка. Вместе с тем, явный ме- 
тод обладает много меньшей трудоемкостью каждого шага и в отличие от 
неявного метода не требует постоянного разрешения уравнения относитель- 
но х,у. Возникает следующий вопрос. 


ВОПРОС 15 


Зачем может потребоваться неявный метод ломаных Эйлера, если его 
локальная погрешность соизмерима с погрешностью явного метода, а 
объем вычислений на шаге заметно выше? 


Ранее уже отмечался главный недостаток методов Адамса — необходимость 
в стартовых алгоритмах. Анализ формул (4.1.1)—(4.1.5) показывает, что 
повышение степени метода дается ценой повышения порядка разностного 
уравнения. Нельзя ли повышать степень метода так, чтобы алгоритм оставал- 
ся одношаговым? Ответом на этот вопрос является подход, реализованный в 
методах типа Рунге — Кутты. 
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4.2. Методы Рунге — Кутты. 
Программа РКР45 


Метод трапеций (4.0.5) является неявным. Что произойдет, если вычислить 
х„.| сначала по формуле (4.0.3), а затем уточнить по (4.0.5)? 


Хх = Х,, + АЕ (1,,х,), 


р ; 
Хи+1 = Хи + 2 (г [ее Хи ) + (а. ›Хи+1 )) 


Полученный одношаговый метод, называемый методом Эйлера — Коши, 
является уже явным. Как будет показано, он имеет вторую степень, которая 
достигается ценой двух вычислений функции #(/,х) на каждом шаге. 


(4.2.1) 


Приведем еще один пример. Сделаем полшага с помощью явного метода ло- 
маных Эйлера, а затем используем полученное значение в квадратурной 
формуле средних прямоугольников, примененной к интегралу в (4.0.2): 


* ћ 
Хи+1/2 = Хи + (ьх»), 
4.2.2 
й + } 
Хо = Х/ + ИЁ и > Хи? ї 


Этот метод, называемый усовершенствованным методом ломаных Эйлера, 
также имеет вторую степень и требует двукратного вычисления #(/, х). При- 


веденные примеры укладываются в следующую схему. Вычислим (/,х) 


дважды в некоторых точках и их линейную комбинацию используем для 
получения х, |: 


К = А(2,,х,), 
К, = ИЕ (1, +0,А,х, +В,К.), (4.2.3) 
Хин = Хи + РК, + рК). 


Параметры ру, р›, 92, В, будем выбирать так, чтобы разложение форму- 


лы метода (4.2.3) в ряд максимальным образом совпадало с разложением 
точного решения (4.1.11). С этой целью отметим, что согласно (4.0.1) 
„ 4 9 


Хх =# (1х), х= —– + —#, 
0 дх 
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и (4.1.11) имеет вид 


Раскладывая (4.2.3) в ряд и приравнивая коэффициенты при соответствую- 
щих степенях й, добиваемся того, что формула (4.2.3) задает методы второй 
степени 


ОЕ О | 
Ох 


ді (4.2.4) 


р+р =, р) =1/2, р,В =1/2. 


Условия (4.2.4) представляют собой три уравнения с четырьмя неизвестными 
и, следовательно, методов второй степени вида (4.2.3) оказывается бесконеч- 
но много. В частности, определяя параметры р = р, =1/2, о, = В, =1, по- 
лучаем метод Эйлера — Коши, а набор р =0, р, =1, о, = В, =1/2 задает 
усовершенствованный метод ломаных Эйлера (4.2.2). В то же время постро- 
ить метод третьей степени с двумя вычислениями Ё ({, х) не удается. 


Увеличивая число вычислений функции #({,х) на одном шаге, получаем се- 
мейство методов Рунге — Кутты в виде 


г—| 
Ку = Их, ), К, = А, +о,А,х, + У В, |, Г=Ь2,..., 5, 


і=1 


5 
Хи+1 = Хи + >. Р,К,. 


=] 


Коэффициенты методов вычисляем аналогично тому, как это было выполне- 
но для методов второй степени. При этом если для метода второй степени 
достаточно рассчитать #(/,х) два раза на одном шаге, то метод третьей сте- 


пени требует трех вычислений {(/, х), а метод четвертой степени — четырех 


таких вычислений. Все эти методы, как и методы второй степени, образуют 
семейства. Среди них наиболее популярными являются следующие методы 
третьей степени: 


Ку = А(1,,х,), К =А(0, + 2/2,х, +2), 


К, +4к, + К (4.2.5) 
Ку =Й( + Ах, К +26), х, =х, 63 


б 
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и четвертой степени: 
К, =ИЕ( хи), К, = ИЕ (1, Е.Х, + Кү 12), 
К; = АҒ(1, +А/2,х, +, /2), К. = (1, + й, х, +3), 


К, +2К. + 2к, + К 
х) к, (0020 ме | 


(4.2.6) 


Как уже отмечалось, если функция Ё (7, х) в (4.0.1) не зависит от х, то все ме- 


тоды интегрирования дифференциальных уравнений превращаются в соот- 
ветствующие им квадратурные формулы. 


ВОПРОС 16 


Каким квадратурным формулам отвечают методы Рунге — Кутты 
третьей (4.2.5) и четвертой (4.2.6) степени? 


С увеличением степени метода резко возрастает число параметров р,, со,, 


В,;, а также число нелинейных уравнений для их определения. Оказывается, 


что метод Рунге — Кутты четвертой степени является последним методом, у 
которого количество вычислений {(/, х) на одном шаге совпадает со степе- 


нью метода. Уже метод Рунге — Кутты пятой степени требует вычислять 
функцию #(/,х) шесть раз, шестой степени — семь раз, седьмой степени — 


девять раз, восьмой степени — одиннадцать раз. С дальнейшим ростом сте- 
пени методов трудности их построения растут по экспоненте. Так в литера- 
туре [50] описывается пример метода десятой степени с 17 вычислениями 
(Ех) на шаге! 


Теперь обратимся к такому важному моменту, как контроль погрешности 
метода в процессе интегрирования. Представляется весьма желательным ис- 
пользование переменного шага интегрирования подобно тому, как это дела- 
ется в программах, реализующих адаптивные квадратурные формулы (на- 
пример, программа оолмсв из [14]). Хотелось бы выбирать малый шаг там, 
где решение меняется быстро, и большой, где оно меняется относительно 
медленно. Оценивать погрешность по отбрасываемому члену разложения 
(4.1.10) чрезвычайно неудобно. Поэтому на практике используются различ- 
ные другие подходы для контроля локальной погрешности методов. Один из 
них состоит в сравнении на каждом шаге интегрирования решений, получае- 
мых по формулам методов различных степеней. Этот подход реализован в 
программе вКЕ45 из [14], построенной на методах Рунге — Кутты — Фель- 
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берга четвертой и пятой степени. Фельбергу удалось так подобрать парамет- 
ры методов, что одни и те же шесть вычислений К, функции {(/,х) с раз- 
личными весами р, используются для получения решения методами и чет- 
вертой, и пятой степени: 


(4) о (5) в 
п+] =х,+ У, р,К, 5 Хи. =х,+ У р, К,, 


=] =] 


х 


6 ж 
их =>, (р; —Р, ) К, 


=] 


› < 


Тогда разность между этими решениями может использоваться для контроля 
величины шага дискретности. Программа имеет следующие параметры: 


ККЕ45 (Е, М, Х, Т, ТООТ, ВЕ ‚АЕ, ТЕТАС, МОКК, ТМОВКК) 
где. 


О Е — имя процедуры, написанной пользователем для вычисления правых 
частей системы (4.0.1). Эта программа должна иметь, в свою очередь, 
следующие параметры: 


Е(Т, Х, 0Х) 


Здесь х — вектор решения в точке т, ох — вектор производных, 


У 


м — количество интегрируемых уравнений; 


Ч 


х — вектор решения размерностью м в точке т на входе в программу и в 
точке тоот при выходе из нее, 


Ч 


т — начальное значение независимой переменной на входе в программу 
(при нормальном выходе это тоот); 


тоот — точка выхода по независимой переменной; 
ВЕ, АЕ — границы относительной и абсолютной погрешностей; 
иовк — рабочий вещественный массив размерности бч + 3; 


тиовк — рабочий целый массив размерности не менее 5; 


о,шоо 


ТЕЪАС — указатель режима интегрирования. Обычно при первом обраще- 
нии на входе ТЕЬАС = 1, а при последующих обращениях на входе 
ТЕГАС = 2. Нормальное выходное значение ІғІАС = 2. Другие выходные 
значения указывают на возникшие отклонения от нормального процесса 
интегрирования: 


• 3 — заданное значение вЕ оказалось слишком малым и требуется его 
увеличить; 
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е 4 — потребовалось более 3000 вычислений #(/,х) (это отвечает при- 


близительно 500 шагам). Можно, не изменяя тЕТАС, снова обратиться 
к программе или, если система является жесткой, применить специ- 
альные алгоритмы решения жестких систем (о явлении жесткости см. 
разо. 4.3); 


е 5 — решение обратилось в нуль, а АЕ равно нулю. Требуется задать 
ненулевое значение дЕ; 


• 6б — требуемая точность не достигнута даже при наименьшей допус- 
тимой величине шага, и требуется увеличить дє и ве; 


• 7 — слишком большое число требуемых выходных точек препятству- 
ет выбору естественной величины шага (он может быть значительно 
увеличен при заданной точности). Нужно или увеличить тоот-т, или 
задать значение ІЕІАС = 2 и продолжить работу программы; 


• 8 — неправильное задание параметров процедуры (например, м < 0, 
АЕ < 0, КЕ < 0). 


В заключение раздела целесообразно ответить на следующий вопрос. 


ВОПРОС 17 


Какой видится перспектива построения программы, аналогичной 
ВКЕ45, на основе методов Адамса, например, четвертой и пятой степе- 
ни? Какие дополнительные проблемы здесь придется решать? 


4.3. Устойчивость методов. 
Ограничение на шаг интегрирования 
и явление жесткости 


Подменяя анализ глобальной погрешности анализом локальной, мы выска- 
зывали непременное условие такой замены — обеспечение устойчивости ре- 
шения разностного уравнения метода, которая, в свою очередь, зависит не 
только от формулы метода, но и от шага интегрирования. В отсутствие воз- 
можности оценить глобальную погрешность и устойчивость метода в общем 
случае появляется желание выбрать некоторую простую модельную ("тесто- 
вую") систему уравнений и рассмотреть, как формируется глобальная по- 
грешность для нее. 
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Такой тестовый пример должен удовлетворять двум требованиям. С одной 
стороны, он должен быть достаточно простым, чтобы можно было выпол- 
нить необходимый анализ, а с другой стороны, он должен быть достаточно 
"представительным" в том смысле, что сравнительные выводы о свойствах 
устойчивости различных методов должны носить относительно общий ха- 
рактер и распространяться на значительный круг задач. Этим требованиям 
удовлетворяет система линейных уравнений 


сЕ 
Е, Ах(/) (4.3.1) 


с постоянной матрицей. Она является достаточно представительной, т. к. лю- 
бая нелинейная система может быть линеаризована в окрестности некоторой 
точки решения и заменена системой (4.3.1). Если какой-либо метод проде- 
монстрирует негативные свойства в смысле устойчивости на примере систе- 
мы (4.3.1), трудно ожидать от него хороших свойств на нелинейной задаче 
(обратное, разумеется, не всегда верно). 


Пусть все собственные значения А, матрицы А лежат в левой полуплоско- 


сти. Тогда решение системы дифференциальных уравнений (4.3.1) будет 
асимптотически устойчиво. Чтобы численный метод адекватно отражал ре- 
альность, необходимо потребовать, чтобы его разностное уравнение также 
обладало асимптотически устойчивым решением. 


Первоначально обратимся к явному методу ломаных Эйлера. Его формула 
(4.0.3) применительно к (4.3.1) записывается в виде 


Хх, =Х, ЛАХ, =(Е+ЛА)х,. 
Для асимптотической устойчивости решения разностного уравнения необхо- 
димо, чтобы собственные значения матрицы Е + АА, равные 1+ АА,, по 
модулю были бы меньше единицы (+ АА, | < П) что для вещественных от- 


рицательных А, приводит к выполнению неравенства 
151+ АА <Ь А, |< 2. (4.3.2) 
Для комплексных значений ИЛ, = йо, + Их, условие асимптотической ус- 


< 2 
тойчивости (1+ ло, ) + 20? <1 требует, чтобы их значения находились на 


комплексной плоскости внутри круга с единичным радиусом и центром (-1, 
2006 


(92 +01) 


0), а ограничение на шаг имело вид: й < . Множество значений 
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АА, удовлетворяющих условию устойчивости разностного уравнения мето- 


да, называют областью устойчивости данного метода. Для явного метода 
ломаных Эйлера, который является одновременно методом Адамса первой 
степени и методом Рунге — Кутты первой степени, она представлена на 
рис. 4.1 (кривая 5 =1). 


Рис. 4.1. Области устойчивости явных методов Рунге — Кутты 
(5 — степень метода) 


Является ли условие (4.3.2) на собственные числа А, обременительным для 
практики? Обратимся к примерам. 


Пример 1. Пусть матрица А второго порядка имеет два собственных значе- 
ния: А =-2, А =-1. Решение (4.3.1) содержит две составляющие с экспо- 
нентами ехр(-2г) и ехр(–/). Промежуток наблюдения решения определяется 
самой медленной экспонентой (три—пять ее постоянных времени): 
[=[0, 7|, Т=3. Для построения графика такого решения вполне достаточно 
взять шаг визуализации порядка нескольких десятых и, таким образом, весь 


график будет содержать примерно десять—двадцать точек. Выполнение ус- 
ловия устойчивости численного метода ломаных Эйлера в соответствии с 


(4.3.2) приводит к необходимости удовлетворить неравенствам: АА < 2 


Решение дифференциальных уравнений 133 


и й<|, что вполне согласуется с желаемым шагом построения графика и 
практически не является обременительным. 


Пример 2. Пусть А = -10“, А, = –1. В решении опять две экспоненты и, т. к. 
самая медленная осталась такой же, что и в предыдущем примере, время на- 
блюдения решения осталось прежним: гє [0, 3]. На этот раз на начальном 


участке имеется резко меняющаяся экспонента с малой постоянной времени 


| И 
тр = = 10 *. Для построения графика такого решения необходимо взять 


А 


десяток точек на начальном участке с шагом й ~ 1 07°, азатем практически на 
всем остальном участке решения использовать, как и ранее, шаг порядка не- 
скольких десятых. Однако условие устойчивости (4.3.2) требует, чтобы шаг 
интегрирования неизменно удовлетворял неравенству и весь промежуток ре- 
шения содержал несколько десятков тысяч шагов! Любая попытка увеличе- 
ния шага с нарушением условия (4.3.2) приводит к неустойчивости решения 
разностного уравнения и незамедлительному "взрыву погрешности". Опи- 
санная ситуация будет проявляться тем острее, чем больше разброс между 
собственными значениями матрицы А. 


Системы уравнений (4.3.1) с такими решениями получили название жестких 
систем уравнений. Для них характерны два участка решения. Первый из них 
малой продолжительностью тпс называют пограничным слоем. Решение 


здесь обладает большими производными и изменяется очень быстро. Второй 
участок продолжительностью много больше первого (7 > тс) обладает 


сравнительно малыми производными, и решение носит относительно спо- 
койный характер. 


Всегда ли плохо обусловленная матрица А системы (4.3.1) порождает жест- 
кую систему? Рассмотрим пример. 


Пример 3. Пусть № = 1+ 70, Аз =-1. Число обусловленности весьма 


велико, но разделение на два участка отсутствует, т. к. на всем отрезке реше- 
ния наблюдается сильно осциллирующее решение, требующее малого шага 
визуализации. Для того чтобы плохо обусловленная матрица порождала же- 
сткую систему, необходимо, чтобы большие собственные значения обладали 
большими по модулю отрицательными вещественными частями, и отвечаю- 
щие им составляющие решения практически уже не наблюдались за погра- 
ничным слоем. Важно и выполнение неравенства Г > тис. Нелинейные сис- 


темы (4.0.1) часто относят к числу жестких, когда их матрица Якоби 


134 Глава 4 


обладает вышеназванными свойствами на всем протяжении решения. Более 
строгое определение жестких систем, анализ их свойств и свойств устойчи- 
вости численных методов можно найти в книге [40]. 


Является ли условие (4.3.2) недостатком только явного метода ломаных Эй- 
лера и как ведут себя другие численные методы для жестких систем? К со- 
жалению, все рассмотренные явные методы Рунге — Кутты и Адамса непри- 
годны для решения жестких систем. Так, последовательно применяя методы 
Рунге — Кутты второй, третьей и четвертой степени (формулы (4.2.1), (4.2.5) 
и (4.2.6), соответственно) к системе (4.3.1), получаем следующие разностные 
уравнения: 


2) 
хн =| Е + ЙА + – ь 
242 343 
х, = КоА А ‚А р 
2579 ЗАЗ 4,4 
хи: = да СПА пы Ф 
2 6 24 


и ограничения на шаг интегрирования, подобно (4.3.2) задающие области 
устойчивости: 


<1, (4.3.3) 


<1, (4.3.4) 


<1. (4.3.5) 


Для вещественных отрицательных А, эти ограничения принимают вид: 
О У < 2 — методы второй степени (4.2.1) и (4.2.2); 

О А | <2.513 — метод третьей степени (4.2.5); 

О РА <2.785 — метод Рунге — Кутты четвертой степени (4.2.6). 


Для общего случая комплексных значений А, области устойчивости пред- 
ставлены на рис. 4.1. Так как все области обладают свойством симметрии 
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относительно действительной оси, то воспроизводится только часть границы 
областей, лежащая в верхней полуплоскости. Значения ЙА, внутри этих об- 


ластей удовлетворяют условиям (4.3.3)—(4.3.5). Хотя ограничения на шаг 
интегрирования незначительно ослабляются при увеличении степени метода, 
общий объем вычислений при этом даже возрастает, т. к. растет число значе- 
ний #(1,х), требуемых на каждом шаге. 


Еще хуже обстоят дела с устойчивостью явных методов Адамса. Их разност- 
ные схемы 


| 
Хи Хр > ВИ, == 0, 
і=0 
примененные к (4.3.1), порождают следующую систему разностных уравнений: 
1 
ХХ, ЛА) 0х, = 0. 
і=0 
После замены переменных х = 02, где О — матрица собственных векторов 


КО 


матрицы А, для вектора 2 иего компонентов получаем 


Р] 
131 2, - РАУ Вт, =0, 


іё пі 
і=0 


г] 
0 0 51608) 0 43.6) 


п+1 п 
1=0 


А= ОАО = Фіар(д,А),...,А,). 


Решение разностного уравнения (4.3.6) записывается через корни үу у ёго ха- 
рактеристического уравнения 
| < 1-1 
г [и г—1-— 
У-У А Бү =0. (4.3.7) 
і=0 
Условие устойчивости (4.3.7) предполагает, что все ү у должны быть по 
модулю меньше единицы ү 7 <1. Для вещественных отрицательных значе- 
ний А, необходимым условием этого является выполнение неравенства 
2 
1 р 


>в 


і=0) 


ИА | < 
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что приводит к еще более серьезным ограничениям на йл по сравнению с 
методами Рунге — Кутты: 


О АА | <1.0 — метод Адамса второй степени (4.1.1); 
О АА „| <6/11 — метод Адамса третьей степени (4.1.2); 


О РР | <0.3 — метод Адамса четвертой степени (4.1.3). 


В общем случае для построения областей устойчивости методов Адамса мо- 
жет быть использован следующий подход. На границе области устойчивости 
модуль одного из корней характеристического уравнения (4.3.7) равен еди- 
нице. Поэтому выполним подстановку ү = ехр(іф). Функция 


=> р) ~ ехр(/(” – 1)Фф) 


У Брехр(К"-1- дф) 
і=0) 


при изменении Ф от 0 до л опишет в плоскости ЙА кривую, часть которой 


будет границей области устойчивости рассматриваемых методов. Сами об- 
ласти приведены на рис. 4.2. 


Рис. 4.2. Области устойчивости явных методов Адамса (5 — степень точности) 
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Общая ситуация для вещественных отрицательных значений А, складывает- 


ся следующим образом. Время наблюдения решения Г определяется мини- 
мальным по модулю собственным значением матрицы А, а шаг интегриро- 
вания — максимальным. Тогда число шагов № прямо пропорционально 
числу обусловленности, что и приводит к недопустимым затратам 


И р = — Г дыр. 
А, А |а ћ А Ие 


Чтобы изменить ситуацию, для методов, предназначенных интегрировать 
жесткие системы, следует потребовать, чтобы их область устойчивости 
включала в себя всю или почти всю левую полуплоскость, что позволит уст- 
ранить ограничение на шаг типа (4.3.2) и увеличить шаг, когда пограничный 
слой уже пройден. 


Используем для решения (4.3.1) неявный метод ломаных Эйлера (4.0.4). Со- 
ответствующее разностное уравнение и ограничение на шаг примут следую- 
ЩИЙ ВИД: 


Хи +1 =х, + ЙАх, . = (Е – РА). ‚ |1-АА |>. 


Полагая величину А; комплексной, Л, = а, + /о; , для области устойчиво- 
сти метода (рис. 4.3) получим: 


(1 ло) + Ао2 >1. 


Она включает в себя всю левую полуплоскость, и неустойчивость метода 
проявляется только в круге единичного радиуса с центром (1, 0) (рис. 4.3). 


Еще более интересный результат наблюдаем для неявного метода трапеций 


ных, (Ака + Ах, }; [Е-А) кБ 


2) 
ЙА. 
2 2 2“ 


Тогда для Л; = ©} + јо, получаем 
һо о? һо? о? 
1+—| + с ТЕ 

2 4 4 


что после упрощений приводит к выполнению неравенства йа < 0, т. е. об- 
ласть устойчивости метода совпадает с областью, где устойчивость имеет 
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место для решения дифференциального уравнения. Таким образом, оба алго- 
ритма могут быть рекомендованы для решения жестких систем. Как будет 
видно далее, типичное для неявных методов некоторое увеличение трудоем- 
кости одного шага интегрирования с лихвой окупается большим выигрышем 
в величине шага для жестких систем. 


да 


Рис. 4.3. Область устойчивости неявного метода ломаных Эйлера 


В заключение рассмотрим, как решается проблема неявного задания х, |, 


например, в неявном методе ломаных Эйлера (4.0.4). Решение этого уравне- 
ния относительно х„., может быть сведено к решению следующей системы: 


Е(2) =2-х, – (72.12) = 0 (4.3.8) 


методом Ньютона 


(0) -2®)=-Е (20); ЕЕ. 


где 200) — 4-е приближение к значению х, |. Здесь весьма эффективен мо- 


дЕ 
дифицированный метод Ньютона, когда матрица = вычисляется в точке 
2 
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Хо, раскладывается в произведение треугольных матриц программой РЕСОМР, 


и на последующих итерациях используется только программа $от\Е. Матри- 
ца вновь вычисляется только тогда, когда метод Ньютона перестает сходить- 


ОГ " 
ся за три итерации. Даже если матрица Якоби > исходной системы уравне- 
7 


ОЕ 
ний плохо обусловлена, обращение матрицы =. как правило, не вызывает 
2, 


Г 
затруднении, т. к. она значительно лучше обусловлена, чем А 
7, 


ВОПРОС 18 


Почему последнее утверждение имеет место? 


Как уже отмечалось, метод Ньютона, обеспечивая квадратичную скорость 


сходимости, очень чувствителен к выбору начального приближения. В дан- 


ном случае с заданием 140) проблем не возникает. В качестве 109) может 


быть выбрано значение х, или выполнен шаг явным методом ломаных 
Эйлера 


290) = хо + АЕ х,). (4.3.9) 


В последнем случае уместен следующий вопрос. 


ВОПРОС 19 


Если исходная система жесткая, а вне пограничного слоя желательно 
выбрать достаточно большое значение шага й, то возможно ли опреде- 
лять 20 по (4.3.9) и использовать явный метод ломаных Эйлера, нару- 


шая при этом условие устойчивости (4.3.2)? 


В итоге применение метода Ньютона в неявных алгоритмах может быть опи- 
сано по следующей схеме. 


1. В некоторой точке вычисляем матрицу Якоби по аналитическим форму- 
лам для ее элементов или с помощью формул численного дифференциро- 
вания, а затем производим ее разложение с помощью программы ресСоМР. 


2. По начальному условию 20), рассчитанному с помощью явного метода 


Эйлера, выполняем итерации метода Ньютона для получения х, |. 
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3. После одной-двух итераций по методу Ньютона при достижении сходимо- 
сти переходим к шагу 2. Возвращение к шагу | проводится только в том 
случае, если метод Ньютона перестает сходиться за три итерации. 


Такая организация вычислений приводит к малому объему работы на одном 
шаге, а сам метод Ньютона с хорошим начальным приближением сходится за 
одну-две итерации. 


По аналогичной схеме для решения жестких систем используются и другие 
неявные методы. Методы с областью устойчивости, пригодной для решения 
жестких систем, почти всегда являются неявными, хотя, разумеется, далеко 
не все неявные методы такую область имеют. 


4.4. Численное решение систем линейных 
дифференциальных уравнений 
с постоянной матрицей 


С системами линейных дифференциальных уравнений 


АОБ Ав. х0) (4.4.1) 
а! 
приходится встречаться крайне часто при построении математических моде- 
лей динамических систем. Для их решения может быть применен любой из 
рассмотренных ранее универсальных алгоритмов, но более эффективным 
может оказаться тот метод, который учитывает специфику решения (4.4.1). 
Точное решение системы (4.4.1) имеет вид (П3.14) 


і 
х(0) = ехо + је^ат-Ь. (4.4.2) 

0 
Если решение необходимо представить в виде таблицы при значениях 
„ = иН, где п — целое число, а Н — шаг наблюдения решения, то непо- 


средственное использование формулы (4.4.2) весьма затруднительно. Много- 
кратное вычисление матричной экспоненты и интеграла от нее с помощью 
сходящихся матричных рядов исключительно трудоемко особенно для боль- 
ших значений /, когда приходится учитывать большое число членов ряда. 
Использованию формулы Лагранжа — Сильвестра предшествует решение 
полной проблемы собственных значений и подготовительная работа, связан- 
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ная с формированием матричных множителей, что также весьма затрудни- 
тельно при большом размере матрицы А. 


Выход из этого положения дает метод, предложенный Ю. В. Ракитским и за- 
ключающийся в следующих предварительных матричных преобразованиях. 


Запишем решение (4.4.2) в точке 14 =/ + Н и вычтем из него формулу 


(4.4.2), предварительно умноженную на в 
„+Н 
хи +Н)=е^х(,)+| | е\ат-еАН (ека Ь = 
0 0 
„+Н +11 
= еба, ) + ! емат- | мат |Ь = (4.4.3) 


Н 


Н 
Нут) + [елат-Ъ. 
0 


В отличие от (4.4.2) запись решения в виде (4.4.3) предполагает лишь одно- 
кратное вычисление матричной экспоненты и интеграла от нее для заданно- 
го шага Н, а затем последовательное получение х(/,) пошаговым методом. 


Для вычисления матричной экспоненты и интеграла от нее воспользуемся 
матричным степенным разложением 


2 Н 
А ЕЕ НАНА а Гела н( вз 2А...) (4.4.4) 
0 


Чтобы разобраться со скоростью сходимости этого ряда, обратимся к скаляр- 
ному ряду 


1=1-0.1+0.01/2 —0.001/6+...; 
719 =1-10+100/2-—1000/6 +... 


Ясно, что при больших по модулю показателях экспоненты ряд сходится 
крайне медленно. Если матрица А имеет простую структуру, то она сама и 
ее матричная экспонента могут быть приведены к диагональной форме 


ем" . 0 
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где на диагонали стоят скалярные ряды и скорость сходимости всего матрич- 
ного ряда определяется скоростью сходимости скалярного с максимальным 


по модулю показателем А Н. Для удовлетворительной скорости сходи- 
мости необходимо обеспечить выполнение неравенства Е: <1 или 


достаточного условия для нормы матрицы АА <1. 


Если система (4.4.1) является жесткой, то вне пограничного слоя появляется 
потребность выбрать шаг наблюдения решения Н таким, чтобы 


Е Н »1, а это приходит в противоречие с условием эффективного по- 


строения матричного ряда. Поэтому по заданному желаемому значению Н 


выбирается такое целое число №, что для й = —_ имеет место неравенство 
2 
Аһ е 
ЈАЈА <1. Далее строим е` разложением в матричный ряд, а затем № раз 


возводим матричную экспоненту в квадрат по формуле е2^ = е^ .еА? 


АН 


‚ ДОС- 
тигая матрицы е 


Аналогичная формула удвоения шага может быть получена и для вектора 
А А! 
в(А) = елат: Ь, (2А) = (Е +е "(0 | 
0 
Эта формула удвоения шага легко устанавливается после преобразований 


Р й 21 
(2л) = [елат-Ь = [еат-ь+ | гат: = 
0 0 ћ 


ћ А 
= [елат нел" ЈеАат-Ь = (Е+ А00) 
0 0 


Таким образом, алгоритм решения системы (4.4.1) записывается такой по- 
следовательностью действий: 


1. Задаемся желаемым значением Н. Выбираем целое число М , такое, что 
Н ] 
й = И. кте, 
2* |А| 


2. Для шага й строим матричную экспоненту еАћ и вектор 2(й) разложени- 


ем в ряд с небольшим числом членов. 
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Н 


3. Получаем матрицу е^" и вектор 2(Н), используя № раз формулу удвое- 


ния шага. 
4. Решаем уравнение (4.4.3) пошаговым методом. 


На основе изложенного алгоритма написана программа 1500Е [41] со сле- 
дующими параметрами: 


ТЗОРЕ (№, Н, СН, А, В, Х, ЕАН, 51, ІМРЕХ) 
где: 

О м — размерность системы; 

О н— шаг наблюдения решения; 


О сн — константа для оценки начального шага й (рекомендуемое значение 
для обычных систем — 0,1, а для жестких — порядка 5.0); 


А, В — матрица и вектор системы (4.4.1); 
х — вектор решения; 


ЕАН — матрица, содержащая элементы матрицы ее: 


ѕі — рабочий массив размерности м; 


оо очо 


ТМРЕХ — управляющий параметр с входными значениями: 


• _—| (первое обращение к программе, вектор в нулевой, т. е. решается 
однородная система); 


т —2 (первое обращение к программе, вектор в может быть ненулевым); 
• 0 (не первое обращение к программе). 


Нормальное выходное значение — 0. 


4.5. Решение краевой задачи. 
Методы стрельбы и конечных разностей 


В рассмотренной ранее задаче Коши одно из решений системы (4.0.1) выде- 
ляется заданием начальных условий (К, хо). Однако это не единственный 


способ. Задавая условия при двух или более значениях независимой пере- 
менной, приходим к краевой задаче. 
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В общем случае краевые (граничные) условия выглядят следующим образом: 


Оо, аи <Ь, 1<і<т. 


В зависимости от вида уравнения и краевых условий можно провести клас- 
сификацию краевых задач, схожую с классификацией задач Коши. Важным 
подклассом являются линейные краевые задачи, когда и система (4.0.1) и 
краевые условия являются линейными. Эти условия имеют вид: 


ох) + Вх) +..+ (вх) =а, іт. 
Линейная краевая задача является однородной, если однородны уравнения и 


краевые условия. Такая задача всегда имеет тривиальное решение х(/) = 0, и 


в этом случае представляет интерес отыскание нетривиальных решений. 

В свою очередь, из краевых задач выделяют двухточечные, когда условия 

задаются на левом и правом концах промежутка, т. е. при 1, =а и /, =Ё. На- 

пример, дифференциальное уравнение второго порядка 

Ах(Е) 
а! 


а 
[26 ахо) 70, 


гє[0, 1], р) 2 р> 0, 9(7) > 0, 


где краевые условия х(0) = х(1) = 0 определяют задачу, которая является мо- 


делью многих физических процессов: распределение тепла в неоднородном 
стержне, распределение концентрации вещества в процессах диффузии и др. 


Несмотря на разнообразие форм краевых условий, краевые задачи в основ- 
ном решаются одними и теми же численными методами. Выделяют два ос- 
новных подхода: 


С сведение к многократному решению задачи Коши; 
О сведение к решению алгебраических систем. 


Второй подход включает в себя как конечно-разностные, так и проекционные 
методы. К последним относятся, в свою очередь, давно применяющиеся ме- 
тоды коллокаций, Галеркина, Ритца, а также метод конечных элементов. 


Многократное решение задачи Коши демонстрирует метод стрельбы, имею- 
щий аналогию со стрельбой, когда, зафиксировав недолет или перелет, угол 
стрельбы изменяют так, чтобы следующий выстрел был ближе к цели. 
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Рассмотрим систему из двух уравнений 


ЧУ(Г) _ 
4 


и Лау) Ф(и,и,у), ге[а, В] 


с граничными условиями 
Ф (и(а),у(а))=0, — Ф>(и(В),»(Ь))=0. 


Выберем произвольное значение и, = и(а) и выразим из первого краевого 
условия у(а)=&(и„). С начальными условиями и, и у, проинтегрируем сис- 
тему каким-либо методом. Результатом будут функции и(ри,) и у(1,и,), 
зависящие от и, как от параметра. При подстановке (р, и) и у(р,и,) в пра- 
вое краевое условие получаем функцию относительно и,. Задача свелась к 


нахождению решения уравнения /(и,)=0, где 2(и,) = Ф (и(Б,и,),у(Б,и,)). 


Конкретный вид функции /[(и,) неизвестен, но значения ее для любых зна- 
чений и, легко вычисляются, и это дает возможность воспользоваться лю- 


бым методом нахождения корней нелинейного уравнения. Так, в частности, 
можно воспользоваться уже известной процедурой-функцией 2ЕВОТМ(А, В, 
г, ЕРЗ). Последовательность вызова отдельных процедур отражает рис. 4.4. 


2ЕКОТМ 


Рис. 4.4. Последовательность вызова процедур в методе стрельбы 


Основная программа вызывает 2ЕВОТМ. Предварительно подбираются два 
значения и, = 4 и и, = В, для которых функция Г(и,) имеет различный 
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знак. Программа 2ЕВОТМ вызывает функцию [(и,), которую программирует 


пользователь. Эта функция, в свою очередь, обращается к программе вкЕ45, 
которая вызывает процедуру, вычисляющую Ё([,х). Значение функции /(и,) 


для заданного и, определяется выражением 
І(и,) = Ф, (4(Ь, ио ),у(Б,и,)). 


Описанная ситуация резко упрощается, если задача является линейной двух- 
точечной краевой 
ди 
—— = ри) + 4 (0)У(0) + 51(0); 


аі 
ау 
0 (1)и(1) + 9 (1)У(1) + 5901); 


с граничными условиями 
оци(а) + Вуу(а) = п; 
оои() т В.%(р) = 791 

Тогда из первого условия имеем у(а) = С –оци(а))! В. В силу линейности 


задачи решение будет зависеть от и, линейно, и функция [(и,) также будет 


Р № ж 
линейной. Отсюда следует, что для вычисления и, — левого начального ус- 
ловия для функции и(Г), дающего решение краевой задачи, достаточно два- 
жды проинтегрировать систему до ѓ= Б с двумя различными начальными 


условиями (иі, у.) И (и?, у ), найти 14и!) и Щи?) и линейной интерполя- 
ж * 
цией определить и„. Таким образом, и, будет корнем уравнения 


и + 2-0. 
а 


Иа 


и, и 


| 
ии -и 


б мә м 


Другой подход к решению краевых задач заключается в их сведении к реше- 
нию систем линейных и нелинейных уравнений. Здесь одними из наиболее 
популярных являются конечно-разностные методы, иллюстрацию работы 
которых проведем на примере линейной краевой задачи: 


Д? 
= + р(ї н +40)у0) = Л};  те[а, В], 
а 
си У(а) + В, 10) о у(Б) + В, 5 - ү». 
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Вводя дискретные значения независимой переменной 


р-а 
=) +К П, й = М э і =а, (м = 6, Ук = у(), 
запишем в этих точках исходное уравнение, предварительно аппроксимировав 


первую и вторую производные по формулам численного дифференцирования: 
2 
ЧУ.) Урны Укл. а Уб) Уры 27 + У 
4 21 аг р 


В результате получим систему линейных алгебраических уравнений относи- 
тельно у, 


ар + су = К =1,2,..., М –1, (4.5.1) 
где 
й Ир 
а = - А Б, =2-Й 74; па 


Граничные условия в такой ситуации принимают вид: 


—У2 +4у -3% =. 
2Һ 


Зум = 4уу + уу 
азун +8, 0—01 2021, 


Здесь использовались формулы численного дифференцирования (1.12.3) и 
(1.12.5) для дифференцирования в начале и в конце таблицы. Выразим с по- 
мощью (4.5.2) значения уд и уру и подставим их в первое и последнее урав- 


оу + В 
(4.5.2) 


нения системы (4.5.1). После приведения подобных слагаемых каждое из 
этих двух уравнений будет содержать только два неизвестных 


Е : а _ Е 2- 
Бу + у =-Й Л; ар-лум-2 +бу-лУу- = А Ум. (4.5.3) 
Уравнения (4.5.1) для К = 2, 3, ..., М-2 совместно с (4.5.3) порождают ли- 
нейную систему с трехдиагональной матрицей 
ао о 
а) Ь, С? 0 Т 0 


0 а3 Ь. Сз 
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При этом можно использовать естественный порядок исключения неизвест- 
ных. Модификация метода Гаусса применительно к таким системам получи- 
ла название метода прогонки. Получим расчетные формулы метода. 


Решение системы (4.5.1) и (4.5.3) будем искать в следующем виде: 
Ук = Оу! + Фр; К; 2 М2, (4.5.4) 
Отсюда выразим у;_у через у: 
Ук = Фр лу + Ча = Өрөр + (9, +) (4.5.5) 
и подставим выражения (4.5.4) и (4.5.5) в (4.5.1): 


ГӨ, (Өр +) + |у + ы (29+) ++ | = 0. 


Приравнивая отдельно каждую квадратную скобку нулю, получаем уравне- 
ния для получения Ө; и Ч; : 


о“ арф +03, 
Е УИА: а 
. к Р. кр (4.5.6) 
© ==. Е шел 
б И 


Выражения для Өү и Ұ'; получаются непосредственным сравнением (4.5.4) с 
первым уравнением (4.5.3). Нахождение коэффициентов ©, и Ч’, по фор- 


мулам (4.5.6) называется прямой прогонкой. Теперь, когда эти коэффициенты 
найдены, по формуле (4.5.4) последовательно определяем у,, начиная с 


Уул: Для задания уу] запишем (4.5.4) для К = М-2 и воспользуемся вто- 
рым уравнением (4.5.3): 


Ум_2 = @х_2 Ум + Ч м5; 
7 Е: = 02 ў 
ам-1Ум-2 Ом Ум = №-1: 
Решая эти два уравнения совместно, для уу. получаем 


ра 2 зу 
ауд уә + А Ју 


= (4.5.7) 
Бу + йу Өу-2 


Ум = 


Нахождение у; по формулам (4.5.4) и (4.5.7) называется обратной прогонкои. 
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Можно показать, что Достаточным условием успешного применения метода 


прогонки является выполнение следующих условий для коэффициентов сис- 
темы (4.5.1): 


а +0, с +0, |6, |>[а |+], К=Ь2,..М-2; |1, |а| <). 


Число арифметических операций в традиционном методе Гаусса для большой 
заполненной матрицы пропорционально примерно кубу ее размера, в то время 
как рассмотренный метод обладает трудоемкостью, зависящей от размера 
лишь линейно. Поэтому для решения краевых задач целесообразно иметь спе- 
циальную программу метода прогонки, как альтернативу рЕСОМР и ѕ01ує. 


В заключение отметим, что нелинейные краевые задачи аналогичными прие- 
мами сводятся к решению некоторой уже нелинейной системы уравнений. 


4.6. Решение краевой задачи. 
Введение в проекционные методы 


В данном разделе кратко ознакомимся с идеями методов коллокации, Галер- 
кина и конечных элементов. В основе их построения лежит аппроксимация 
решения дифференциального уравнения конечной линейной комбинацией 
базисных функций. При этом ограничимся иллюстрацией на примере линей- 
ной двухточечной краевой задачи 


2. ро 0) |+ = (0); 100, 1] 
[ аі 


с простейшими краевыми условиями у(0) = у(1) = 0. 


Приближенное решение будем искать в виде 
И 
У(Р) = >. кф), 
к=] 


где базисные функции Ф| (/), Ф (/), ..., Фф, (7) удовлетворяют граничным ус- 
ловиям задачи: ф, (0) = Ф, (1) = 0. 


Первоначально обратимся к методу коллокации. На отрезке [0, |] выберем 


п точек ѓу, 1, ..., ѓ,. Потребуем, чтобы приближенное решение в этих точ- 
ках удовлетворяло уравнениям 
71 Я п п 
4 дат И +901) 6,9; 0,) = Ли), т=1,...,п. 
Ш аі = 11, к=] 
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После дифференцирования и группировки слагаемых получим линейную 
систему алгебраических уравнений для нахождения коэффициентов су, яв- 


ляющихся компонентами вектора с = (с,с›,...,с, ) | 
И 
Ас=Г Уас =Л(,)  т=1,...,п; 
к=] 
а = (1) (т) + Ри) Фи) +90), (1). 


ВОПРОС 20 
Из какого предыдущего раздела заимствована основная идея метода 


коллокации? 


Перейдем к методу Галеркина. Здесь коэффициенты с, приближенного ре- 


шения выбираются таким образом, чтобы невязка приближенного решения 


(1) 
а а 
(1) = О) +а()уб) - Л@) 


была бы ортогональна всем базисным функциям 
(700), Ф„(0)) = 0. 


Переписав скалярное произведение в соответствии с его определением в про- 
странстве непрерывных функций 


Га а Е 
Е о) +490)у0)– ј оф, (Да = 0, 


подставив в интеграл искомый вид решения и поменяв местами суммирова- 
ние и дифференцирование, получаем также систему линейных алгебраиче- 


ских уравнений относительно сх: 


п | 
Ас=Г, У ас = Гат), т=]|,... ү; 
к=] 0 


а А 4 09 0) +09 ор (Гат. 
тА к Я Я! К А т 
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ВОПРОС 21 


А с каким предыдущим разделом перекликается основная идея метода 
Галеркина? 


Интегрируя по частям первое слагаемое под знаком интеграла для а 


80 4Ф,„(ї ) 
а! 


т> Имеем: 


ы; (е (фо. 


Такое представление коэффициентов а, уже не требует, чтобы приближен- 


ное решение (и базисные функции) обладали вторыми производными. Это 
обстоятельство является также весьма важным в одном из вариантов метода 
конечных элементов, о котором будет сказано позже. 


Примерами базисных функций, удовлетворяющих краевым условиям, могут 
служить: 


О Ф, (1) =5іп(кл); 


П 0; (1) =01-0); ф;(0) = 901) =0; 6=1,2,...„п. 


По поводу систем уравнений, возникающих в методах коллокации и Галер- 
кина, следует сделать два замечания. Во-первых, матрицы коэффициентов в 
обоих методах в общем случае являются заполненными. Напомним, что, на- 
пример, в методе конечных разностей матрица была трехдиагональной. 


Во-вторых, преимущество метода Галеркина перед методом коллокации в 
задаче из данного раздела в том, что его матрица симметрична. 


В заключение обратимся к методу конечных элементов. Это проекционный 
метод со специфическими базисными или координатными функциями. Ими 
являются В-силайны (базисные сплайны), обладающие таким свойством, что 
любой сплайн-полином на отрезке отыскания решения может быть представ- 
лен линейной комбинацией В-сплайнов. 


В качестве базисных функций в методе Галеркина воспользуемся кусочно- 
линейными функциями вида 
(1—11), р 115 


ФВ = 4 (0р1), 1; 
Ог > + 5 < 1-1. 
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Это линейные В-сплайны, представляющие собой так называемые "функции- 
крышки". Их производные — кусочно-постоянные функции: 

ИИ <<; 
а е 
О -Ип, 5; 

0, > <р. 


Наличие разрыва в точках 1,1, 4, ѓу не влияет на интегрирование, кото- 


рое проводится отдельно по каждому участку разбиения: 


ФЕ) 49,00) 
= ———— +9(1)0. (0)Ф,, (0) |9. 
г) а 
Произведения 29059 и Ф; (/)ф,„ (1) по определению функций Фф, (/) то- 


ждественно равны нулю всегда, кроме А -1< т< +1, т.е. а, = 0, если 
т> 1. Это означает, что не равны нулю лишь коэффициенты ащ, арц, 


а; кар Т.е. матрица А линейной системы трехдиагональная, как и при при- 
менении конечно-разностного метода. 


Естественно, с одной стороны, возможно использование сплайнов более вы- 
соких степеней, например кубических, что должно привести к уменьшению 
ошибки аппроксимации. С другой стороны, вычисление коэффициентов ад 


по методу коллокации проще, поскольку не требует интегрирования, как в 
методе Галеркина, и поэтому метод коллокации с В-сплайнами является ра- 
бочим методом, где матрица линейной системы также трехдиагональная. 
Выбор метода для конкретной краевой задачи — сравнительно простого ко- 
нечно-разностного или более трудоемкого проекционного — требует анализа 
специфики самой задачи. 


4.7. Введение в методы решения уравнений 
в частных производных 
Наличие в реальных процессах не одной, а нескольких независимых пере- 


менных приводит к математическим моделям, описываемым дифференци- 
альными уравнениями в частных производных. 
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Наиболее часто встречающиеся типы этих уравнений второго и первого по- 
рядка проиллюстрируем простыми примерами: 


О уравнение переноса 
ди ди 
— =-а--+ } (х), 
ОЕ Ох 
С уравнение теплопроводности (диффузии), называемое уравнением лара- 


болического типа 
ди _ 2 ди ди Ә?и 
дї дх’ ду’ Ф? 


2 


О волновое уравнение, называемое уравнением гиперболического типа 
ди [0и ди ди 


ео 2 
дг? Әх? ду? д2? 


О уравнение потенциала (уравнения Пуассона, Лапласа), называемое урав- 
нением эллиитического типа 


Эти названия отражают суть типичных физических явлений и процессов, 
описываемых приведенными уравнениями. 


Как и в случае обыкновенных дифференциальных уравнений, для выделения 
одного решения необходимо задать начальные и (или) краевые (граничные) 
условия. Здесь выделяют условия Дирихле, когда задается начальное распре- 
деление функции и(Ё,х, у, 2) на границах области ее изменения, условия 


Неймана, когда определяется изменение функции и(/, х, у, 2) на границе, а 
также их различные комбинации. 


Проблемы, возникающие при решении уравнений в частных производных, 
настолько обширны, а постановки задач настолько разнообразны, что в дан- 
ном разделе остановимся лишь на некоторых простейших подходах к их ре- 
шению. При этом чаще всего исходная проблема сводится к уже известным 
задачам решения обыкновенных дифференциальных или алгебраических 
уравнений. 


В качества первого примера рассмотрим одномерный случай уравнения теп- 
лопроводности с соответствующими начальными и граничными условиями 


2 
бы и(0,х) = (х), ш(,0) = м1) = 0. 
д ә? 


154 Глава 4 


Введя дискретизацию по переменной х с обозначениями ху =КАх; Ах =1/и; 
хо = 0; х, =1 и используя для второй производной простейшую формулу 
численного дифференцирования, получим систему уже обыкновенных диффе- 
ренциальных уравнений относительно и, (Е) = и(ѓ, х, ): 


ди, (1 
= - ТЕ. (ик) 20,00) + шщ 100); 1,2,1. 


При этом м (Г) = 0, и, () = 0, а начальные условия определяются равенства- 
МИ и, (0) = (х), К ==]; 0-1. 


Матрица полученной линейной системы имеет специфический трехдиаго- 
нальный вид, а ее собственные значения, определяющие характер поведения 
отдельных составляющих решения, в этом случае могут быть определены 
аналитически и рассчитываются по формулам: 


А, = - та 1+оозёт) к= 1,...,и-–1. 
п 


Для числа обусловленности матрицы имеет место выражение 


бду вы с А Т+соҳт/т) 1+ соз(п/п) 
Аа Аа 1+ соѕ(л(и– 1) /т) 1-со$(л/и). 


При больших значениях л это отношение примерно равно 4н? І п. 


Таким образом, уменьшение величины Ах, с одной стороны, повышает точ- 


ность аппроксимации, а с другой — делает систему более жесткой со всеми 
вытекающими из этого проблемами. Такой способ сведения уравнения в ча- 
стных производных к системе обыкновенных дифференциальных уравнений 
получил название метода прямых. 


Второй вариант этого метода основан на идеях проекционного подхода. Для 
той же задачи с теми же граничными условиями будем искать решение в виде 


и) = У (00, (о), 
к=0 


где Фо(х), ф(х), .., Фф, (х) — базисные функции, удовлетворяющие гра- 


ничным условиям, т. е. Ф, (0) = ф, (1) = 0. Как и ранее, вводя дискретизацию 
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ж 
по х, потребуем, чтобы в точках х, функция и (х,/) в таком виде удовлетво- 
ряла точно дифференциальному уравнению 


5.40 фи (х х)= У ас 000) ец а Фиби) РОЯ 


ко Я 0 


В векторной форме эта система бы вид: 


Фф) _ т ас(і) _ 1 орм я 22 Т 
т аФ"с(/); Т Ф” Ф"ео(г); с(г) = (со,...„с,) . 
Фо(хо) -.. Ф, (хо) Фо(ж) -.. Ф (х0) 

Ф = 5. Эк р Ф" и ИИ 
Фобх,) ... фи (хи) Фо(хи) ... фи(хи ) 


ж 
Начальные условия с, (0) получают из равенства и (х,, 0) = /(х;). 


Таким образом, согласно методу прямых исходное уравнение в частных про- 
изводных сводится к системе обыкновенных дифференциальных уравнений с 
начальными условиями. При этом используется программное обеспечение, 
разработанное для решения задачи Коши. 


Еще один подход к решению уравнений в частных производных предполага- 
ет дискретизацию по всем независимым переменным. В качестве примера 
рассмотрим одномерное волновое уравнение (гиперболического типа) 


2 2 
СЕИ О<х<}; {20 
ғ Әх 
с начальными и граничными УСЛОВИЯМИ 
ди(х,0 
и(х,0) = Хо), 2420 = (х), ибо = о, и(,0)= В. 


Технология метода предполагает замену производных в уравнении и началь- 
ном условии двусторонними и односторонними формулами численного диф- 
ференцирования. Прямоугольную сетку по х и { выберем для простоты рав- 
номерной: /, = ПАГ, х, = тАх, ищи = и(х,,1,), 


д?и 2и 1 
Р) 5 п=1,2,....М-1; 
Ї 
Хто у 
92и и ОИ И. 
А 5 2 т+1,п те т-1,п = І, 2, Т №1 
х Ах 
Хи ) 


6 Зак. 3418 
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Решение находится последовательно по временным слоям для фиксирован- 
ных значений {, на заданной сетке. Нулевой слой использует начальное ус- 


ловие и, о = / (хи). На первом слое учитывается второе начальное условие: 


Ип. 1 Ип, 0 
а р(х,) ПО МЫ 
А 
Начиная со второго временного слоя, используются основные рабочие фор- 


мулы, учитывающие аппроксимацию вторых производных по х и {: 


2 
Ит и = 2\т п — Имп т 9 ОТЕТ а. итп + И ти ] 


Таким образом, решение будет представлено таблицами функции и(х,,, г, ) 


для каждого 2, на временной сетке с шагом ДЕ. 


Используемые аппроксимации производных свидетельствуют о втором по- 
рядке точности разностной схемы как по времени, так и по пространственной 
переменной. Не вдаваясь в подробности, приведем условие устойчивости 
разностной схемы, связывающее значение двух шагов дискретизации 


Ах 
А; < —. 
Уа 


Проиллюстрированный на простом примере подход применим, разумеется, и 
к более общим задачам для одного или нескольких уравнений. При этом не- 
обходимо постоянно помнить о возможном возникновении неустойчивости, 
т. к. провести соответствующий анализ часто не представляется возможным. 


Ранее рассматривались лишь простейшие аппроксимации производных и яв- 
ные методы. Значительно более эффективными являются неявные методы. 
В частности, неявный метод получим, если при записи системы уравнений вто- 
рая производная по пространственной координате будет отнесена не к точке /,, 


как в явном методе, а к точке /,. у. Аналогом может служить неявный метод 
ломаных Эйлера при решении обыкновенных дифференциальных уравнений. 
Теперь для того, чтобы найти решение послойно, необходимо, в отличие от 


явного метода, для каждого слоя решать систему уравнений относительно 


Ил +1 Е 


2 
А 
И т п+1 ее 2и Ип] +а ее СУТ з 2и ніі Еа И н-1,п+і ). 
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2 
Вводя обозначение ие и перенося все известные слагаемые в пра- 


вую часть, получаем 
НИ п] ЕЕ (1 к ни ых НИт- пч] = И — Ит.п-1: 


При записи первого и последнего уравнения необходимо учесть граничные 
УСЛОВИЯ: Ио „31 = 0; Им и! = В, которые в данном случае те же, что и в явном 


методе. Таким образом, для каждого слоя решаем систему с одной и той же 
трехдиагональной матрицей (что учитывается). Дополнительные потери во 
времени для одного слоя по сравнению с явным методом чаще всего обора- 
чиваются существенным выигрышем в устойчивости, что позволяет иметь 
временную сетку гораздо более редкой и значительно сократить общие вы- 
числительные затраты. 


Наконец, рассмотрим конечно-разностный метод для уравнения Пуассона 
(эллиптический тип): 


дби Ә?и 

ео) 

ох ду 

В качестве области исключительно для простоты будем рассматривать еди- 
ничный квадрат 0< х <1, 0< у<1 на плоскости (х, у) с равномерной сеткой 


и одинаковым шагом й по обеим пространственным координатам. Здесь 


| 
й = а где № — количество внутренних узлов сетки. В качестве гранич- 
+ 


ных условий на сторонах квадрата рассмотрим условия Дирихле: 
и(х, у) = 8(х, у), где р — заданная функция двух переменных. 


Используя по-прежнему формулы численного дифференцирования для вто- 
рых производных, сведем исходное уравнение к системе линейных алгебраи- 
ческих уравнений для всех внутренних точек области: 


И] Ба и, у ег 4и у — и 1,} = И р = = И} = и (іл, т). 
При этом на границе выполняются условия: 


и) у = 8(0,у;), Им, у = 80, У, ), и. 0 = 2(х,,0), И; М+1 = 5(х;,1). 
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Соотношения для внутренних узлов образуют систему из № 5 уравнений, ко- 


торую можно записать в матричной форме Ах = – ИГ, где 


В, -Е, .. 0 0 4-1. 00 
-Еу Ву .. 0 0 14... 0 0 
А = >; , 
Ву -Ем 0 4 -| 
0 0... -Еу В, 0 0. 1 4 


а Е» — единичная матрица порядка Мх №. 


Компоненты векторов 2, б, Г определены следующим образом: 
7 
2 = (ии М чьим зош озону) А 
Т 
ВЕ а о е а) 


ь= (5..6), Ы 


= 


= (ио + Ир0: 02,0: ИМ 1,05 Им,0 Им), ), 


р; = (м0, 0-м ), і=2,...,М№М –1; 


Ьу = (иом М, М+1> 2, мн у, м Им, М + Им, М ) 


Полученная матрица является разреженной. При № = 100 имеем 10° уравне- 


ний и 10° элементов А. Вместе с тем, каждая строка А содержит не более 
пяти отличных от нуля элементов. Для подобных матриц разрабатываются 
специальные способы их хранения и обработки в памяти компьютера, позво- 
ляющие эффективно решать задачи такого класса. 


Для решения уравнений в частных производных (особенно эллиптического и 
параболического типа), устойчивое распространение имеют проекционные 
методы и, в частности, метод конечных элементов. В этой книге данный под- 
ход был проиллюстрирован на решении краевых задач для обыкновенных 
дифференциальных уравнений. Здесь отметим только, что он успешно ис- 
пользуется и для задач данного раздела. 


ГЛАВА 5 


Введение 
в минимизацию функций 


В практических приложениях часто возникает задача определения максиму- 


ма или минимума вещественной функции ие ее и от и веществен- 


ных переменных на множестве $ и-мерного пространства (такие функции 
называют функуионалами). В дальнейшем ограничимся лишь поиском мини- 
мума, т. к. при возникновении задачи на максимум достаточно сменить знак у 
минимизируемой функции. Если множество $ совпадает со всем и-мерным 
пространством, то задачу минимизации называют безусловной. В противном 
случае задача имеет ограничения (обычно в виде совокупности нелинейных 


функций 2, удовлетворяющих равенствам или неравенствам) 
га о Г х”) >0, оо, 


определяющие множество >. 


Задачи с ограничениями, как правило, много сложнее задач безусловной ми- 


нимизации. Если функция / и ограничения 20 являются линейными функ- 


циями, то говорят о задаче линейного программирования. Если ў или какая- 


либо 2? нелинейная, имеем задачу нелинейного программирования. В дан- 


ной главе ограничимся знакомством с некоторыми подходами к решению 
задач безусловной минимизации. Более того, как и в разделе, посвященном 
решению нелинейных уравнений, рассмотрим методы нахождения локаль- 
ных минимумов, попутно отметив, что в настоящее время нахождение гло- 
бального минимума уже для. п> 2 часто представляет непреодолимые труд- 
ности. 


160 Глава 5 


5.1. Минимизация функции 
одной переменной 


Предположим, что для /(х), определенной на [а, Ь], имеется единственное 
РЯ 
значение, отвечающее минимуму / на [а, В]. При этом для х> х функция 


ж 
у(х) строго возрастает и для х<х строго убывает. Такая функция называ- 
ется унимодальной, ее минимум может достигаться как внутри промежутка 
[а, |, так и на его краях. В дальнейшем речь будет идти именно об унимо- 


дальных на заданном промежутке функциях. 


ж 
Обозначим за = требуемую точность определения х . Тогда задача миними- 


зации состоит в сокращении промежутка неопределенности [а, 6] до @ 5] 


ж РО и 79 
так, чтобы х [4,6 | и р-а<ғ. 


Если функция вычислена в некоторых точках хо и ху промежутка неопреде- 


ленности, то возможны три варианта расположения минимума и сокращения 
промежутка неопределенности: 


О /(х)> (х1), отбрасываем [а, ж |, х < х (рис. 5.1, а); 
О (х0) < 7 (х), отбрасываем [х, Ь] ‚ № > х' (рис. 5.1, 6); 


О (х0) = (х), отбрасываем [а, х,] и [5,5], ж<х < (рис. 5.1, в). 


Ф © 
© е ® Ф 
ж * ж 
о нЕ. === ваа и, 
а х; х 6 а х, х 6 а № хр ЁБ 
а б в 


Рис. 5.1. Варианты расположения минимума 


Отсюда очевидно, что значение #(х) необходимо вычислить, как минимум, 
в двух точках внутри промежутка [а, Ь], чтобы последний мог быть сокра- 
щен. 
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Простейший метод половинного деления на очередном шаге вычисляет 
а+ь $ а+ь 
= =— И Х| = 


2 Д 
совпадающих с серединой [а, 6]. Если, например, / (х0) < (х1), то проме- 


5 
функцию в двух точках: хү = т, С ТОЧНОСТЬЮ до — 


жуток сокращается почти в два раза, и процедура повторяется уже на [а, Х| |. 


Следует отметить, что значение /(хо) уже вычислено, и если бы точка х; 


находилась в оптимальном для последующего поиска положении, то очеред- 
ное сокращение интервала неопределенности могло бы достигаться ценой 
лишь одного дополнительного вычисления /(х). Метод половинного деле- 


ния не использует эту возможность, и точка ху отбрасывается, т. к. располо- 
жена слишком близко к правому концу промежутка [а, х |. Повысить эф- 
фективность алгоритма позволяет следующая постановка задачи. 

Разрешено вычислить /(х) заданное число раз п. Необходимо использовать 
эти вычисления так, чтобы максимально сократить длину промежутка воз- 


ж 

можного нахождения х . При этом достаточно очевидно, что на каждом ша- 
ге две точки внутри промежутка следует располагать симметрично относи- 
тельно его середины, т. к. нет оснований предпочитать одну из половин 
промежутка. 

Пусть на некотором шаге имеем промежуток длиной Р;. Расстояние от ле- 
вого конца промежутка до внутренней правой точки х; обозначим за 
Е, а до левой хуз — за Руз. Если (хр) < (х1), то длина нового 
интервала сокращается до А, _, точка х,_› становится уже правой, а новая 
левая точка хуз должна быть уже расположена так, чтобы хуз и хрз бы- 


ли симметрично расположены относительно середины промежутка. Это 
условие симметричности порождает очевидное соотношение для старого и 
нового интервалов: 


= Е 1+6, у= +з. (5.1.1) 


На последнем шаге наиболее выгодна ситуация, когда приходим к некоторо- 
му интервалу неопределенности длиной 2, причем точка ху, унаследован- 


ная с предыдущего шага, расположена ровно в середине (А = А /2). Тогда, 
вычислив /(х) в точке ху, почти совпадающей с ху (Е о Ё, |хо -м|<=), 


сократим промежуток практически в два раза. 
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Числа Р,, называемые числами Фибоначчи и вычисляемые в соответствии с 


(5.1.1), определяют наиболее эффективное разбиение промежутка и опти- 
мальное решение задачи. Значения К и А задаются единичными: 


Е = Б =Ь Б = 2, Б =3, БЕ = 5, Е = 8,... 


Е 
На первом шаге длина исходного промежутка [а, р} уменьшается в — раз, 


а внутренние точки имеют координаты: 
хд =а+(-а)Е [Е и ә =а+(ь-а)Е, ,[Е,. 

На последующих шагах длина интервала неопределенности сокращается в 

| Ен Ке В 

Ра Риз В 


} и- 


раз соответственно. Напомним, что разбиение промежутка с использованием 
чисел Фибоначчи оптимально тогда, когда заранее известно количество и 


вычислений /. Длина исходного интервала при этом сокращается в РА, раз с 
точностью до $8. 


Если число и заранее неизвестно, то числа Фибоначчи перестают определять 
оптимальное решение задачи. Условие симметричности (5.1.1) должно со- 
хранять свой вид, однако требование Ё = А =1 должно быть заменено. Вме- 
сто него потребуем, чтобы две внутренние точки делили промежуток в одной 
и той же пропорции на каждом шаге минимизации для каждого нового ин- 
тервала. Гакое условие "повторяемости ситуации" приобретает вид 


и 1р Е. (Е) 1, 
Г Е Р, 01 


И- 


или а? +а-1=0 и а. = (/5-1)/2 = 0,618. Этот метод получил название 


метод золотого сечения (рис. 5.2) и для своего очередного шага не требует 
знания /, поскольку для любого промежутка [а, Ь внутренние точки все- 
гда имеют координаты: хе, = Ь-ам (Ь-а) и Хправ =а+о (р-а). Зависи- 
мость алгоритма от и очевидна, т. к. на каждом шаге промежуток сокраща- 


ж 
ется ровно в 1/а раз. 
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Первоначальный промежуток неопределенности 


Новый промежуток неопределенности 


0.618 0.382 


Рис. 5.2. Метод золотого сечения 


Если количество и вычислений функции (х) известно заранее, то метод 


минимизации с числами Фибоначчи сокращает исходный промежуток в Е, 


п-і 


ж 
раз, а метод золотого сечения в (1/а ) раз (на первом шаге этого метода 


функция вычисляется дважды). Можно заметить, что при больших значениях 
частное этих двух величин стабилизируется. Для объяснения последнего 
факта запишем точное решение разностного уравнения (5.1.1) с единичными 
начальными условиями, определяющими числа Фибоначчи: 


Е = КСМИ НИНОЙ 25 = 
" №5 2 `5 2 „5 


С ростом п второе слагаемое решения стремится к нулю, что дает возмож- 


г Ш ] 
ность записать іт = —{ұ. 
по и] С, 


| 
ОН ч [- № | ( н" 
——— — — — == — С, 


ж 
С, 


Метод золотого сечения аналогично методу бисекции поиска корней нели- 


г ж 
нейного уравнения на каждом шаге сокращает промежуток в 1/о раз неза- 
висимо от вида унимодальной функции. 


ВОПРОС 22 


Такое гарантированное сокращение промежутка независимо от вида 
функции является достоинством или недостатком алгоритма? 
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Извлечь возможные выгоды из предполагаемой гладкости функции позволя- 
ет метод последовательной параболической интерполяции. Этот алгоритм на 
каждом шаге ориентируется на три точки: х,_›, х;у, х,. По ним строится 
парабола (интерполяционный полином второй степени) и вершина этой па- 
раболы (точка минимума) определяет значение х,у, которое заменяет х,_. 


Сочетание методов последовательной параболической интерполяции и золо- 
того сечения демонстрирует процедура-функция ЕМТМ (А, В, Е, ЕРЗ), идео- 
логия которой весьма созвучна с программой 2ЕВОТМ для поиска нуля функ- 
ции. Используя второй метод, программа по возможности переключается на 
первый. Как и в 2ЕВОТМ, Параметры А и в определяют интервал поиска, г — 
вычисляемую функцию, а ЕРз — границу погрешности. Есть, однако, важное 
различие между этими программами, которое влияет на выбор величины $, 
задающей параметр ЕРЗ в ЕмІМ. Если / (х) = 0, а /(х) +0, то для малых Е 


имеем 


Р(х +) = Г(х) + 5Г'(х) +5? "(х) 12+... = Ех). 
Малые изменения в х вызывают пропорционально малые изменения в Х(х), 
поэтому разумно выбирать границу погрешности для 2ЕВОТМ примерно той 
же величины, что и ошибки в значениях функции (зачастую это величины 
порядка ошибки округления в данном компьютере). 
Если же мы ищем точку минимума, где /(х) = 0, а (х) = 0, то для малых 
Е получаем: 


(+=) = Р(х) + =/"(х)+5* Х"(х)/2+...= (х) +? (х) 72. 


2 


2 


Изменение порядка Е в х теперь вызывает изменение в /(х) порядка = 


поэтому разумно выбирать границу погрешности для ғмІМ не меньше, чем 
квадратный корень из ошибки в значениях функции. Иными словами, если 
простые нули функции можно находить почти с полной машинной точно- 
стью, то точки минимума — лишь с половинной. 


5.2. Введение 
в многомерную минимизацию 


Теперь обратимся к постановке задачи безусловной минимизации функции 


многих переменных Ро) = (50, Р А. Если эта функция непрерывна 
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вместе со своими частными производными, то задача минимизации может 
быть сведена к решению системы нелинейных уравнений 


у и ү 
вгаа У (х) = [25 05.0)” ео = 0, (5.2.1) 


задающих нулевое значение компонентам вектора градиента /(х). С другой 


стороны, пусть задана некоторая система нелинейных уравнений 
Ф, (х) = а(х (0 д2), х) = 0, К =1, 2, ..., т. (5.2.2) 


Вместо ее решения можно минимизировать некоторую функцию 
м 2 
(х) = У, ф(х). (5.2.3) 
к=] 


Ее минимум равен нулю и достигается при тех же значениях х, которые 
удовлетворяют системе (5.2.2). (Строго говоря, здесь могут появиться по- 
сторонние локальные экстремумы.) Минимизация (5.2.3) часто проводится 
специальными методами, учитывающими особый вид минимизируемой 
функции. 


Поскольку между методами минимизации функций и методами решения не- 
линейных уравнений существует тесная связь, типовой является следующая 
ситуация. Если имеется хорошее начальное приближение к точке минимума 
минимизируемой функции / (х), то целесообразно перейти к решению сис- 


темы (5.2.1), например, методом Ньютона с квадратичной скоростью сходи- 
мости. С другой стороны, при решении нелинейных уравнений (5.2.2) в от- 
сутствие хорошего начального приближения целесообразно получить его, 


используя первоначально методы минимизации применительно к функции 
(5.2.3). 


Для дальнейшего рассмотрения различных методов минимизации введем не- 


ж 
которые обозначения и определения. Пусть х — точка минимума / (х), а 


* У 
х, — п-е приближение к х . Множество значений вектора х, удовлетво- 


п 
ряющих уравнению 


(х) = с,, 
где с, — некоторая константа, будем называть поверхностью уровня (линией 
уровня) функции (х). 
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Зададимся некоторым вектором у,. Он может выбираться сравнительно 
произвольно, но не должен быть направлен по касательной к поверхности 
уровня в точке х,. Тогда новое приближение может быть определено по 
формуле 

Хи =Х, +ЙУ,. (5.2.4) 
Обязательно найдется такое значение л (положительное или отрицательное), 
при котором / (х,у) < /(х,). Различные методы отличаются друг от друга 
выбором вектора у, и величины й. В частности, при заданном векторе у, 


значение л может выбираться из условия минимума функции 
(й) = Р(х, + йу, ). 


Задача свелась, таким образом, к минимизации функции одной переменной 
Ҹ(л), и здесь могут быть использованы любые методы, в том числе из пре- 


дыдущего раздела. Вместе с тем, следует отметить, что отсутствует практи- 
ческая необходимость в нахождении точного минимума функции Ч(Й), тре- 


бующего многократного вычисления Г(х). Целесообразнее удовлетвориться 
некоторым значением й таким, что / (х,у) < /(х,), сменить вектор у, на 
ур И продолжить минимизацию в другом направлении. Рассмотрим раз- 


личные варианты выбора вектора у,. 


Если в качестве у, выбирать компоненты вектора х, то имеем методы по- 


координатного спуска. Если назначать все компоненты ХК) в строго опреде- 
ленном порядке (циклически), получим обычный (циклический) покоорди- 
натный спуск. Когда же выбор очередного компонента носит случайный 
характер, имеем случайный покоординатный спуск. Наконец, если на каждом 
шаге в качестве у, выбирается тот компонент, в направлении которого (х) 
убывает быстрее всего, получаем релаксационный покоординатный спуск. 

В последнем случае нужная координата будет определяться номером того 
компонента вектора градиента, который максимален по модулю. Вместе с 
тем, если вектор градиента необходимо строить, то целесообразно использо- 
вать уже методы не покоординатного, а градиентного спуска (скорейшего 
спуска), когда в качестве у, выбирается вектор антиградиента и формула 


метода для положительного значения й приобретает вид 


Хон = Хи й гай / (х„). (5.2.5) 
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ООН ЕВЕ ЕН Е ЕО аана ВКЛ ЗЕ СИЕ еси ото о ИИ ЕЕ 


При таком подходе к минимизации использование оптимального значения й 


Убх) = тіп У —Й ага УС, 


приводит к методу наискорейшего градиентного спуска. 

Название последнего метода создает иллюзию, что метод с лучшими свойст- 
вами создан быть не может. Действительно, вектор антиградиента 
(гад / (х„)) является направлением наибольшего убывания функции, но... 
в окрестности данной точки х„. Это направление в т-мерном пространстве 
отнюдь не обязательно указывает на точку минимума функции /(х„) и 


слишком часто бывает весьма далеким от желаемого. Примером, когда век- 
тор градиента не является удачным направлением для минимизации даже для 
функции лишь от двух переменных, может служить так называемая тесто- 
вая функция Розенброка 


2 2 
Об, х@) =100 [6 Е 0) + ( — х ) (5.2.6) 
с начальным значением хо = (0.5, 0.5) и точкой минимума х’ = (1, 1)’. 


Нормированный вектор антиградиента в точке ху имеет вид: 
у, = –вгай /(хо) = (-0.68491, —0.72863)'. 


* 
Движение в этом направлении явно не способствует приближению к х , что 
легко видеть по значению ху, полученному методом наискорейшего гради- 


ентного спуска: 
ху = (0.612, 0.381)'. 


Справедливости ради следует заметить, что и методы покоординатного спус- 
ка демонстрируют для этой функции крайне медленную сходимость к точке 
минимума. 


ж 
Если имеется хорошее начальное приближение к х , то для минимизации 
функции /(х) может быть использован метод Ньютона (3.2.3), примененный 


к системе нелинейных уравнений (5.2.1), отражающих необходимое условие 
экстремума. 
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Матрица Якоби применительно к вектору градиента приобретает вид: 


Е уе В т 
ах дх() дк ах“) с дхФдх(") 
2р ду ду ду 
Рет дх(2) ах  ахох?  ахФохт (5.2.7) 
а юз е 
дх")ахФ ах” ах) = дх(") Әх") 


и называется матрицей Гессе минимизируемой функции / (х). Сам метод 


Ньютона минимизации функций в этих обозначениях выглядит следующим 
образом: 


Н(х,.1 =х,)= –вгай /(х,). (5.2.8) 


Естественно, что он обладает достоинствами и недостатками, отмеченными 
нами в разд. 3.1 для алгоритмов (3.1.5) и (3.2.3). Среди них одним из важ- 
нейших является сочетание высокой скорости сходимости с требованием хо- 
рошего начального приближения. Возможен вариант и модифицированного 
метода Ньютона с постоянной в течение нескольких итераций матрицей Н. 


Однако есть и одно важное отличие матрицы Гессе в формуле (5.2.7) по 
сравнению с произвольной матрицей Якоби в (3.2.3), заключающееся в 
симметричности Н. Напомним ряд характерных свойств симметрических 
матриц. 


1. Симметрические матрицы имеют только вещественные собственные зна- 
чения (см. теорему 2 в разд. 173.3). 


2. Собственные векторы симметрической матрицы, отвечающие различным 
собственным значениям, ортогональны (см. теорему 3 в разд. 73.3). 


3. Если матрица симметрическая и (х, у) — скалярное произведение, то 
(Ах,у)=(х,Ау) (подробнее см. разд. П3.2). 


4. Из теоремы 3 в разд. 13.5 следовало, что матрица простой структуры (ко- 
личество линейно независимых собственных векторов равно размеру мат- 


рицы) подобна диагональной матрице А : А = ОАС!, причем на диаго- 
нали А стоят собственные значения матрицы А. Для симметрической 


матрицы формула диагонализации приобретает более простой вид. Дейст- 
вительно, пусть столбцами матрицы 0 являются собственные векторы и, 
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матрицы А, нормированные так, что (и,, и; )=1. Тогда О070=Е и 


07 =0 '. Матрицу О с таким свойством называют ортогональной. Фор- 


мула диагонализации в такой ситуации принимает вид: А = ОО”. 


5.3. Явление овражности 
и дифференциальное уравнение 
линии спуска 


При интегрировании нелинейных дифференциальных уравнений возникала 
ситуация, когда крайне сложно было анализировать глобальную погрешность 
в общем случае и свойства различных методов изучались на примере "тесто- 
вой" системы линейных уравнений с постоянной матрицей. Такая "тестовая" 
система должна была быть, с одной стороны, достаточно простой, а с дру- 
гой — сравнительно "представительной" в том смысле, что сделанные выво- 
ды о свойствах различных методов должны были носить широкий характер и 


распространяться на значительный круг задач. 


Нечто подобное возникает и при сравнении различных методов минимиза- 
ции. Какова же здесь "тестовая" функция? Гладкая функция одной перемен- 
ной в окрестности точки минимума может быть неплохо описана параболой, 
а функция многих переменных — квадратичной функцией: 


1.т т у т 
70) == (Ах, х) + (Ь,х)+с ры ЕЕЕ (5.3.1) 
2 1 і=1 
связанной в т-мерном пространстве с поверхностями второго порядка. Здесь 
А — заданная симметрическая матрица; 6 — постоянный вектор; с — кон- 


ж 


станта. Выражения для градиента, матрицы Гессе и точки минимума х ми- 
нимизируемой функции (6.3.1) имеют вид: 
027 * -1 
огад / (х) = Ах +, 22 = А х =-А В, (5.3.2) 
х 
где х — точка минимума (х). 


Теперь выясним, как выглядят линии уровня квадратичной функции (5.3.1), 
удовлетворяющие уравнению /(х) = сопѕї. Первоначально выполним замену 
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переменных в (5.3.1) х=у- АГЬ, отвечающую лишь переносу начала коор- 


динат: 
1 СЕ = 
7==(Ау,у)+с', с =с- (БА ь) 


Следующая замена переменных у = О2 с ортогональной матрицей О, столб- 
цами которой являются нормированные собственные векторы А, означает 
лишь поворот осей без растяжения: 


у = (А02, Ш) + -(07А0е)+ Е 
| А * | 208) ' * 
=5(Аз,1)+с 672 Р Ба (5.3.3) 


где А, — собственные значения матрицы А. 


Все значения А, полагаются положительными, в противном случае квадратич- 


ная функция не имеет конечного минимума. Формула (5.3.3) свидетельствует о 


( 


том, что линии уровня функции / в координатах 2 ) представляют собой эл- 


липсоиды. Направления их осей совпадают с 2 


| 
МА 
Е к Е 
Покоординатный спуск в осях 2%) не вызывает трудностей при различных соот- 
ношениях между А, . Если при минимизации по каждой координате достигать 


‚ а длины осей пропорциональ- 


НЫ (вдоль координат с большими А, эллипсоиды больше сплюснуты). 


точного локального минимума, то через т шагов получим точный минимум. На 
ж 
рис. 5.3 иллюстрируется этот факт для случая двух переменных (х. = х ). 


Возвращаясь от вектора 2 к вектору х, приходим к выводу о том, что линии 


уровня квадратичной функции (5.3.1) представляют собой эллипсоиды, про- 
извольным образом ориентированные в пространстве. Направления осей оп- 
ределяются собственными векторами матрицы Гессе, а их размеры пропор- 


] 
циональны е Если матрица А плохо обусловлена, то линии уровня 
А.К 


имеют сильно вытянутый характер и покоординатный спуск становится 


крайне неэффективным в осях х(®) (рис. 5.4). 
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Рис. 5.3. Успешная минимизация вдоль осей эллипса 
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Рис. 5.4. Минимизация овражной функции 
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Расстояние до точки касания очередной линии уровня оказывается очень ма- 
лым, и для достижения точки минимума нужно выполнить большое число 
шагов, которое катастрофически возрастает с увеличением числа обуслов- 
ленности матрицы Гессе. Как видно из реального примера на рис. 5.4, уже 
первые шаги метода имеют величину порядка одной сотой, в дальнейшем 
они еще более уменьшаются, а минимуму функции отвечают значения пара- 


метров х) = х0) =3. 


Такие функции с сильно вытянутыми линиями уровня и плохо обусловлен- 
ными матрицами Гессе получили название овражных функций. Примером их 
в трехмерном случае будут следующие два варианта: 


О Л ->^4, > А — эллипсоид похож на иглу; 
О Л >), > А — эллипсоид похож на диск. 


Ситуация с большим количеством шагов и часто неприемлемым объемом 
вычислений при минимизации овражных функций характерна и для методов 
градиентного спуска. 


Наконец, минимизация функции (5.3.1) методом Ньютона (5.2.8) с учетом 
выражений (5.3.2) приводит к следующему результату: 


Хир =Х, — 22 огай / (х) =х,- А! (Ах, +) = -АЪ=х. 
Ох 
Таким образом, для квадратичной функции метод Ньютона теоретически 
приводит в точку минимума за один шаг. Однако на практике для овражной 
функции применение метода Ньютона связано с обращением плохо обуслов- 
ленной матрицы А, что влечет за собой хорошо известные последствия в 
виде потери точности решения. 


Выполненные выше преобразования и вид рис. 5.3 и 5.4 подсказывают выход 
из создавшейся ситуации: вычислить собственные векторы матрицы А, пе- 
рейти от координат вектора х к координатам вектора 2 и в этих осях приме- 
нить обычный покоординатный спуск, что, как уже отмечалось, позволяет 
легко достичь минимума даже при большом разбросе собственных чисел. 
Такой метод получил название метода обобщенного покоординатного спус- 
ка [54]. Если минимизируемая функция отлична от квадратичной, то опреде- 
ляют в некоторой точке матрицу Гессе и ее собственные векторы, а затем 
минимизируют исходную функцию вдоль этих собственных векторов, пока 
не произойдет значительное замедление сходимости. Затем матрицу Гессе 
вычисляют в новой точке и т. д. Для нахождения компонентов вектора гради- 
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ента или элементов матрицы Гессе, когда отсутствуют их явные аналитиче- 
ские выражения, можно использовать формулы численного дифференциро- 
вания. 


Рассмотрим еще один подход к минимизации функций, в том числе и овраж- 
ных. Уже отмечалась глубокая связь задачи минимизации функций с задачей 
решения систем нелинейных уравнений. Такая же связь существует и с зада- 
чей решения систем дифференциальных уравнений специального вида. 


Пусть все компоненты вектора х зависят от некоторой переменной т и яв- 
ляются решением следующей системы дифференциальных уравнений: 


ах(т 
0 ) _ -огай / (х). (5.3.4) 
Как при этом меняется функция /(х) с изменением т? Для ее производной 
имеем выражение: 


а(х). аў @х® 


ах 
грати - [вез бо. = (ога /(х), ега /(х)) < 0, 


свидетельствующее о том, что с ростом т эта функция непрерывно убывает и 
достигает минимума в точке, отвечающей нулю ее градиента. Система (5.3.4) 
называется дифференциальным уравнением линии спуска. 


Теперь можно "забыть" о задаче минимизации /(х) и решать уравнение 


(5.3.4) одним из численных методов, рассмотренных в главе 4. Компоненты 
вектора х будут изменяться в зависимости от т, одновременно обеспечивая 
уменьшение /(х). 


А если (х) проявляет овражные свойства? 


Для квадратичной функции с учетом (5.3.2) уравнение линии спуска (5.3.4) 
приобретает вид: 


(т) ль (5.3.5) 
ат 


Матрица А в рассмотренном "тестовом" случае имеет положительные Л, и 


в случае овражности плохо обусловлена. Тогда система (5.3.5) обладает 
асимптотически устойчивым решением, но при этом является жесткой. Си- 
туация не меняется и для неквадратичной /(х): овражная функция приво- 
дит к жесткости дифференциального уравнения линии спуска (5.3.4). И хо- 
тя для решения последнего приемлемы уже далеко не все алгоритмы главы 4 
(несостоятельны явные методы Рунге — Кутты, Адамса и пр.), с успехом мо- 
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гут быть использованы специальные методы интегрирования жестких сис- 
тем, в частности неявные разностные схемы ломаных Эйлера И трапеций. 


Таким образом, все сказанное позволяет свести проблему минимизации ов- 
ражной функции к интегрированию жесткого уравнения (5.3.4). И здесь каж- 
дому методу решения жестких систем будет соответствовать свой алгоритм 
минимизации. Проиллюстрируем сказанное следующими рассуждениями. 


Пусть функция /(х) является овражной, а уравнение (5.3.4) — жестким. По- 


пробуем решать его явным методом ломаных Эйлера, понимая полную бес- 
перспективность такого подхода. Тогда формула метода принимает следую- 
ЩИЙ ВИД: 


Хи! =Х, — А сга Л(х,„). (5.3.6) 


Дальнейшее нетрудно предсказать. Условие устойчивости явного метода ло- 
маных Эйлера (4.3.2) вынуждает использовать крайне малую величину шага 
р, что в конечном счете приводит к неоправданно большому объему вычис- 
лений. Но формула (5.3.6) в точности совпадает с выражением (5.2.5), опре- 
деляющим метод градиентного спуска минимизации функций. Таким обра- 
зом, минимизация овражной функции градиентным методом столь же 
"интеллектуальное" занятие, что и решение жесткой системы явным методом 
ломаных Эйлера! 


Обобщая полученные результаты и результаты, представленные в третьем и 
пятом разделах, приходим к выводу о том, что в трех весьма далеких, на пер- 
вый взгляд, задачах плохая обусловленность матрицы порождает три про- 
блемы: 


О плохую обусловленность при решении линейных систем алгебраических 
уравнений; 


С явление жесткости при интегрировании дифференциальных уравнений; 
С овражность при минимизации функций. 


В первом случае это приводит к низкой точности решения, а в двух других — 
к большому объему вычислительных затрат при использовании традицион- 
ных алгоритмов. 


Теперь остановимся на некоторых типичных затруднениях (помимо овраж- 

ности), встречающихся при минимизации функций, и в качестве примера рас- 

смотрим два из них. 

1. Функция /(х) имеет существенно различную чувствительность к изме- 
нению различных независимых переменных, что может быть следствием 
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плохого масштабирования. Иллюстрацией может служить овражная 
функция 


ТА (х0 ‚ х(2) )= 100х000 + 0.0 142) х2) (5.3.7) 


| 2 
сильно зависящая от изменения х и слабо — от х А если обе перемен- 
ные принимают значения одного порядка. Замена переменных с масштаб- 


ными множителями х“) = 0.1 У, хб) =10 уб) устраняет этот недостаток 


и в новых координатах делает функцию неовражной. В более сложных си- 
туациях не всегда удается так легко изменить масштаб функций, как в 
этом примере, особенно если аналитические формулы для /(х) отсутст- 
вуют. Однако в любом случае перед началом процесса минимизации ре- 
комендуется предварительно выполнить масштабирование, чтобы чувст- 
вительность /(х) ко всем компонентам вектора х стала бы соизмеримой. 


Здесь уместно отметить, что при интегрировании линейных жестких сис- 
тем х’=Ах такая замена х = ру ничего не давала, поскольку в новых ко- 


ординатах матрица системы оказывалась подобной исходной и имела те 
же собственные значения: 


у’ = (ЮАР у. 


В задаче же минимизации новая матрица Гессе уже не является подобной 
старой и свойства овражности после замены переменных могут сущест- 
венно различаться: 


] ] Тит 
=—(Ах,х) =-( Ару, Бу) = {р АБу,у |. 

а )==(Ару,ру) = 5 ( У,у) 

2. В выражении для /(х) переменные могут оказаться взаимосвязанными, 
что иллюстрируется простым примером: 


по Е -6) с (5.3.8) 


Минимальное значение /(х) равно 7/2, но в оптимальной точке каждая из 


(1) И хб?) может принимать различные значения при заданном 


(1) 


переменных х 


хб?) = 6. В этих условиях минимум / определяется одно- 
(К) 


произведении х 


значно не для компонентов х ``, а для некоторых их комбинаций, называе- 


мых "комплексами" (или "агрегатами"), число которых меньше, чем коли- 


©] 


чество х Однозначно в координатах хб) задача может быть решена 


лишь с привлечением какой-либо дополнительной информации о х®. 
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В тех случаях, когда аналитические формулы для /(х) отсутствуют и ком- 
плексы явно не определяются, важно предварительно выяснить: 


О какие параметры образуют комплексы; 


О каков минимальный объем дополнительной информации для однозначно- 


го определения всех х 3 


Ответить на эти вопросы помогает следующая методика. 


* л 

Первоначально, минимизируя /(х), находим вектор х , обеспечивающий 
ж * 

минимум /(х )= / . Если имеет место образование комплексов, то значе- 


ж 
нию / отвечает некоторое множество параметров х, отражающих эти ком- 
плексы. Для выделения параметров, входящих в комплексы, изменив один из 


У `` * 
параметров хб) от наиденнои точки х на некоторую величину и зафикси- 


ровав его значение, проводят минимизацию за счет остальных параметров. 


ф жж жж ж 
Если в некоторой точке х удается получить # (х )= 7 , то зафиксирован- 


НЫЙ параметр входит в комплекс. Более того, в комплексы входят также все 


* жж 
параметры, значения которых в векторах х их различаются. 


После этого изменяют и фиксируют поочередно остальные компоненты век- 
тора х, вхождение которых в комплексы на предыдущих шагах не было ус- 
тановлено, и проводят поиск минимума / по оставшимся нефиксированным 
параметрам. 


Если при выполнении этих процедур оказывается невозможным получить 


ж 
значение минимума /, близкое к Ё , то это означает, что фиксированный 


ж 
параметр в комплексы не входит. Тогда его значение в векторе х считается 
найденным однозначно, фиксируется таковым и на дальнейших этапах не 
изменяется. 


Когда, таким образом, определен перечень параметров, входящих в комплек- 
сы, на основании дополнительной априорной информации о процессе число 


независимо варьируемых хб?) понижают на единицу и повторяют указанную 


процедуру в пространстве меньшей размерности. Понижение размерности 
пространства на единицу может осуществляться различными способами, на- 
пример: 


О фиксацией одного из параметров; 


О наложением некоторой связи на х®), в соответствии с которой какой- 
либо из них будет изменяться в зависимости от другого ит. п. 
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Вся методика легко автоматизируется и может включать лишь элементы диалога 
для введения исследователем априорной информации о параметрах модели. 


В настоящем разделе мы ограничились рассмотрением задачи безусловной 
минимизации. Условная минимизация требует специальных подходов, чаще 
значительно более сложных. В качестве примера обратимся лишь к иллюст- 
рации основной идеи методов штрафных и барьерных функций, позволяю- 
щих преобразовать исходную задачу в эквивалентную последовательность 
задач без ограничений. 

Требуется найти минимум функции (х) при ограничениях на вектор х, 
записанных в виде неравенств 


ск (х) > 0, Е =1, 2, ..., 5. (5.3.9) 


Если безусловная минимизация /(х) приводит к результату, когда все усло- 


вия (5.3.9) выполняются, то задача мало отличается от предыдущей. Более 
интересна ситуация, когда минимум достигается на границе разрешенной 
области, т. е. когда одно или несколько неравенств (5.3.9) одновременно пре- 
вращаются в равенства с, (х) = 0. 


Вместо /(х) будем несколько раз минимизировать функцию ЁР(х) 


Е(х) = /(х) + Г(х,а), (5.3.10) 
где Г(х,о) — функция, выбираемая специальным образом; © — параметр, 
принимающий последовательно уменьшающиеся значения, например, 


и=10”, т=1,2,... При этом минимум Е(х) находят при фиксированном 


значении ©, а полученный результат является начальным приближением для 
решения задачи при новом «© ит. д. В основу выбора ТГ(х, а ) положены сле- 
дующие соображения. 


5.3.1. Метод барьерных функций 


Функция 7(х,о0) называется барьерной и выбирается, например, следующим 
образом: 


Г, 0) =а У | 


А 5.3.11 
сю) и 


Начальное приближение ху выбирается внутри области возможного измене- 
ния х, когда все условия (5.3.9) выполняются. В процессе минимизации с 
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ростом числа итераций и значение х, приближается изнутри к границе об- 
ласти, где с,(х)=0, и функция 7(х,о) резко возрастает, образуя "барьер". 


Получившаяся точка минимума используется в качестве начальной для ми- 
нимизации Т(х,0) с меньшим значением а. При этом роль "барьера" сохра- 


няется, но вклад барьерной функции в формирование Р(х) уменьшается. 
Е(х) становится ближе к (х), а новая точка минимума будет еще ближе к 


границе области. Процесс уменьшения © не должен быть слишком быстрым. 
Если изначально выбрать значение а очень малым, то существует опасность 
выйти за границу области при получении очередного приближения х, из-за 


малости Г(х,о) везде, кроме границы. 


Выбор барьерной функции в форме (5.3.11), разумеется, не является единст- 
венно возможным. Так, например, функции барьера с успехом может выпол- 
нять и функция следующего вида: 


Т(х,а) = у Іп с, (х). (5.3.12) 
к=] 


5.3.2. Метод штрафных функций 


Здесь начальное приближение ху выбирается вне области возможного изме- 
нения х, когда одно или одновременно несколько условий (5.3.9) нарушают- 
ся, т.е. с,(х)<0. Функция 7Г(х,о) в этом случае называется штрафной и 
выбирается, например, следующим образом: 


Т (х,а) = 2 У | тіп (0,с, (х). 
07 


к=] 


(5.3.13) 


Параметр с принимает те же значения, что и ранее. Внутри области допус- 
тимого изменения х штрафная функция равна нулю и Ё(х) совпадает с 


1(х). При нахождении х, вне области к минимизируемой функции Х(х) 
добавляется "штраф" 7(х, а), значение которого возрастает по мере умень- 
шения ©. Сказанное приводит к тому, что х, извне стремится к границе об- 
ласти. Напомним, что для барьерных функций точка х, все время находи- 
лась внутри области. 


Мы рассмотрели лишь иллюстрацию основной идеи методов штрафных и 
барьерных функций. Реальные алгоритмы имеют целый ряд весьма важных 
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подробностей. Так, выбор штрафных и барьерных функций весьма богат, и 
при построении Р(х) целесообразно обеспечить нужную ее гладкость, а 


также учесть конкретные особенности #(х). Большие возможности по улуч- 


шению работы методов скрываются в правиле, по которому будет умень- 
шаться значение ©. Следует учитывать также тот факт, что с уменьшением 
© функция Р(х) становится более овражной ит. д. 


В заключение следует отметить, что в тех случаях, когда ограничения на па- 
раметры имеют простой вид, обычная замена переменных позволяет все све- 
сти к решению задачи безусловной минимизации. Так, для ограничений 


х® >0 или а< х) <р соответствующая замена переменных 


2 Ь Ь- 
(0) (00) (207 ыы 
9 = (490) и х9 = +7 


51П 4% 


и последующая минимизация без ограничений по д“) эффективно устраня- 


ют возникшие затруднения. Иногда это может привести к появлению допол- 
нительных экстремумов и некоторых других затруднений, однако в боль- 
шинстве случаев такие замены переменных представляются весьма 
полезными. 


С типичными заменами переменных для различных ограничений, а также с 
методами минимизации овражных функций можно ознакомиться подробнее 
по книге [54]. 


ГЛАВА 6 


И кое-что еще... 


Материал этой главы является более детальным знакомством с проблемами, 
уже рассматривавшимися в предыдущих главах. В частности, он может изу- 
чаться самостоятельно или быть предметом обсуждения на семинарах. 


6.1. Сингулярное разложение матрицы 
и его использование в методе 
наименьших квадратов 


Ранее уже строились два разложения матрицы (Г.0 и ОК). Так матрица с раз- 
личными собственными значениями приводилась к диагональному виду, для 
решения систем линейных алгебраических уравнений 

Ах =Ь (6.1.1) 


использовалось [Д)-разложение матрицы, а для поиска собственных значе- 
ний — ОК-разложение. В главе 2 система (6.1.1) решалась в предположении, 
что 4еКА) = 0. А если 4еКА) =0? А если матрица А прямоугольная? Ответ 


на эти и многие другие вопросы может быть получен с использованием син- 
гулярного разложения матрицы. 


6.1.1. Сингулярное разложение матрицы 


Пусть матрица А в общем случае прямоугольная размера тхи. 
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Определение. Сингулярным разложением матрицы А с вещественными 
элементами называется ее представление в виде 


А = ОХУ, (6.1.2) 
Т Г 
0.0 =Е,, У-У =Е,, 


где О — ортогональная матрица размера тх т; У — ортогональная матри- 
ца размера пихи, а У — диагональная матрица размера тхи с элементами 
с; = 0 при Кяли бр = 6,20. Ем и Е, — единичные матрицы тх ют и 


пхп соответственно. Величины о, Называются сингулярными числами, а 


столбцы матриц О и У — левыми и правыми сингулярными векторами. 


7 И 
Рассмотрим две симметрические матрицы А А и АА” размера ихи и 
тх т соответственно: 


АГА = (05У7 } ОХУ” = УХГОГОХУ 7 = у(х ЈУ”; 
АА? = 05у" | Д ) = ОХУТУУГО! = о Уу! ЈО". 


Пусть для определенности т > п. Матрица АГА подобна матрице УГУ и 
имеет такие же собственные значения, которые, в свою очередь, равны квад- 
ратам сингулярных чисел матрицы А. Аналогично, первые и собственных 


Е ГА 
значений матрицы АА также равны квадратам сингулярных чисел, а ос- 
тальные (т – и) собственных значений являются нулевыми. Другими слова- 


ми, сингулярные числа матрицы А — положительные квадратные корни из 


ненулевых собственных значений матриц АГА и АА” 


Разложение (6.1.2) допускает неединственность построения. Во-первых, оп- 
ределение допускает любой порядок сингулярных чисел на диагонали мат- 
рицы У. Во-вторых, для кратных сингулярных чисел соответствующие 
столбцы О и У определены неоднозначно. И, наконец, в-третьих, последние 
(тп) строк матрицы 5 являются нулевыми, и элементы последних (л – п) 


столбцов О могут выбираться произвольно, т. к. вклад в формирование мат- 
рицы А осуществляют лишь первые и столбцов О. 


Ранг матрицы А (максимальное число ее линейно независимых столбцов) 
совпадает с рангом матрицы >, т. е. с числом ненулевых сингулярных чисел. 
Если для т>и ранг А равен п, то такая матрица называется матрицей пол- 
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ного ранга (в противном случае — недостаточного ранга). Используется 
также понятие эффективного ранга — количество сингулярных чисел, удов- 
летворяющих условию ов; > =, где величина = характеризует погрешность 
представления исходных данных. Через сингулярные числа можно выразить 
число обусловленности матрицы А полного ранга 


еј 
РЕ тах 
сопа(А) = ——, (6.1.3) 
тіп 
где Сах И С — максимальное и минимальное ненулевые сингулярные 


числа соответственно. Это число обусловленности не совпадает с используе- 
мым в (2.1.1), однако обладает похожими свойствами и принимает значения 
примерно того же порядка. 


Построение сингулярного разложения может быть выполнено на основе про- 
граммы зур ("ѕіпршаг уаше десотрозоп"), имеющей следующие параметры: 


$Ур (ММ, М, №, А, И, МАТО, О, МАТУ, У, ТЕВВ, ВУ1) 
где: 


С мм — строчная размерность заявленных двумерных массивов 


(ММ > тах(М, №)); 
м — число строк матриц А и О; 


м — число столбцов л и порядок у; 


А — исходная прямоугольная матрица, 


ооо 


МАТО — логическая переменная; ее значение — ".твоЕ. ", если матрицу о 
нужно вычислять, И ". РАТЅЕ." В противном случае, 


о 


МАТУ — логическая переменная; ее значение — ".твоЕ.", если матрицу у 
нужно вычислять, И". ЕАЪЗЕ ." в противном случае; 


и — содержит м сингулярных чисел матрицы А; 
и — содержит матрицу О из (6.1.2); 


у — содержит матрицу У из (6.1.2); 


поч 


ТЕВВ — значение этой переменной равно нулю, если происходит нор- 
мальный выход из программы, и оно равно К, если в, не было опреде- 


лено после 30 итераций; 


О ву: — одномерный массив промежуточного хранения. 
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Алгоритм построения сингулярного разложения содержит два этапа. На ос- 
нове преобразования Хаусхолдера исходная матрица приводится к двухдиа- 
гональному виду 0, 


А = 00,У/; О, = О АУ, 
где О и У — ортогональные тхт и пхп матрицы соответственно; а у 


матрицы р, ненулевые элементы стоят только на диагонали и на первой 


наддиагонали. Этот этап по своему назначению похож на предварительное 
приведение матрицы к форме Хессенберга в ОК-алгоритме. На втором шаге 
используется вариант ОК-алгоритма, после которого внедиагональные эле- 
менты О. становятся пренебрежимо малы, а на диагонали выстраиваются 


сингулярные числа матрицы А. 


6.1.2. Метод наименьших квадратов 
с использованием сингулярного разложения 


Обратимся вновь к дискретному случаю среднеквадратичной аппроксимации 
(другое название — метод наименьших квадратов (МНК)). Функция (х) 


задается на дискретном множестве тт точек следующей таблицей: 


РЕ Е 


а ее аппроксимация О,„_/(х) выбирается в виде обобщенного многочлена 


Оп-1(х) = ф(х) + соф (х) +...+с,ф,(х) = у скФ,(Х). (6.1.4) 
к=] 


Коэффициенты с; определяются из условия минимума квадрата расстояния 


р’ между О, у(х) и /(х) 


т 


р^ = (О, (х) – 0), О 100) - 00) = (0,10) - Р(х) э тіп. (6.1.5) 


і=] 
Как уже отмечалось в разд. 1. 13.1, необходимое условие экстремума 


ОСО 
дс, р. р стя 


И 
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приводит к системе линейных алгебраических уравнений, которая с ростом 
числа искомых коэффициентов становится катастрофически плохо обуслов- 
ленной. Наиболее надежным способом возникающие проблемы могут быть 
решены с использованием сингулярного разложения матрицы. С этой целью 
несколько переформулируем задачу. Попытка максимально удачно описать 
табличную функцию с помощью О, (х) приводит к следующим прибли- 


женным равенствам: 


| (6.1.6) 
(90си): (О Оа) Геи) 


где элементы прямоугольной тх и матрицы А определяются по формулам 
ар =Фь(х;); і=1, 2,.., т; К=|, 2, ..., п. 
Введем вектор невязки г = Ас – Ї. Задача минимизация его длины 


(гг) —> тіп (6.1.7) 


полностью совпадает с задачей минимизации величины р? в (6.1.5). Таким 


образом, будем искать такой вектор коэффициентов с в системе (6.1.6), что- 
бы квадрат длины вектора невязки был бы минимален. Заменяя в (6.1.6) мат- 


рицу А ее сингулярным разложением ОХУ! и умножая получившиеся 


уравнения на и’ 
ХУ 'с= 01, 
перейдем к новым переменным 
с=с Ё= 0/6 с=У& 1=06. (6.1.8) 
С учетом этих обозначений система (6.1.6) примет следующий вид 
Ус = Ё. (6.1.9) 


Теперь вектор невязки для (6.1.9) принимает следующий вид г = Хс-Ё. Так 
как замены переменных (6.1.8) выполнялись с ортогональными матрицами, 
длина вектора г по сравнению с г осталась прежней. Действительно, 


(гг) = (Ас, Ас) = (ОХУ #,05УТе-ғ)= 
= (5У7е- 07е, ХУТ 07) (хе-хе) (Р). 


Рассмотрим подробнее решение (6.1.9) для различных сочетаний тти и. 
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Случай 1. т> п. Система (6.1.9) разбивается на две подсистемы: 
еу =}, КЕ 25 аи: (6.1.10) 
Оа ў, К=п+1, ..., т. (6.1.11) 


Здесь о, — по-прежнему сингулярные числа. Для удобства будем полагать, 
что все они упорядочены по убыванию: су 26) 2...2 с, 2 0. 


Для т = п подсистема (6.1.11) отсутствует. Минимум значения р? и условие 


(6.1.7) будут иметь место, если система (6.1.10) решается точно (в предполо- 
жении с; #0) 


о р (6.1.12) 


Значение же минимума р? полностью определяется системой (6.1.11) 
т 
(гг) = (6) = У Л (6.1.13) 
и для т = п равно нулю. 
Теперь обратимся к ситуации с нулевыми значениями с, . Первоначально пусть 
только с, = 0. Тогда последнее уравнение подсистемы (6.1.10) переходит в 


2 
(6.1.11), увеличивая значение минимума р’, которое, в свою очередь, определя- 
ется неоднозначно и остается неизменным при произвольном значении с, . Пе- 
реходя к исходному вектору коэффициентов с, с учетом (6.1.8) имеем 


с = Уб= сом + бу, (6.1.14) 


где у, — последний столбец матрицы У, вектор е, определяется одно- 
значно в соответствии с (6.1.12), а значение с, может задаваться произволь- 
ным. Наиболее популярным является задание с, =0. Так как векторы си є 


имеют одинаковую длину, то нулевое значение с, из всего множества реше- 


ний выделяет вектор коэффициентов с с минимальной длиной. В качестве 
альтернативы можно потребовать, например, чтобы из всего множества ре- 
шений предпочтение отдавалось вектору е, который максимально близок к 


* > 
некоторому вектору с . В этом случае с, выбирается из условия 


+ * Э ж е * В 
(е ‚се )= (са + СиУи 6, Сор + Су, —© ) тіп, 
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ж -ы 
В частности, для с =0 этому условию отвечает с, =0. 


Если нулевыми являются несколько последних сингулярных чисел 
б; =0, К=и, 1+1, ..., и, 


то множество решений получается еще более многообразным, чем (6.1.14) 


п 
с = Уб=сор, + о СЕ (6.1.15) 
к=пі 


Здесь у, — последние столбцы матрицы У, а произвольно могут выбирать- 
ся уже несколько последних коэффициентов Сс, . Как и ранее, их нулевые 


значения являются наиболее популярным выбором. 


Мощным инструментарием служит использование в задаче среднеквадратич- 
ной аппроксимации матриц эффективного ранга (количество сингулярных 
чисел, удовлетворяющих условию о; > є, где величина = характеризует по- 
грешность представления исходных данных). Если матрица А плохо обу- 
словлена, и число обусловленности (6.1.3) велико, то чувствительность ре- 
шения к вариации исходных данных оказывается весьма высокой. При этом 
среди сингулярных чисел есть несколько сравнительно малых, и соответст- 
вующие компоненты вектора ©, получаемые из (6.1.12), принимают большие 
значения. Для повышения надежности решения вводится параметр є, харак- 
теризующий точность исходных данных (погрешность эксперимента) или 
длину разрядной сетки компьютера при записи чисел с плавающей точкой. 
Все сингулярные числа, меньшие, чем = , считаются приближенно нулевыми, 
последние уравнения из (6.1.10) переносятся в (6.1.11), а соответствующим 
коэффициентам С, можно задавать произвольные значения. В итоге число 


обусловленности уменьшается до величины 
еј 
сопа(А) = =, 
Е 


Тем самым повышается надежность решения задачи. Одновременно значи- 
тельно уменьшаются по модулю величины коэффициентов с, . Платой за это 


является некоторое увеличение длины вектора невязки (6.1.13), т. е. значения 


р? ‚ по сравнению с минимальным значением. 


На практике, таким образом, может быть реализован следующий компьютер- 
ный диалог. Решающий задачу последовательно увеличивает значение $. 


7 Зак, 3418 
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При этом повышается надежность получения решения ценой некоторого от- 
клонения р? от оптимального значения. Согласуя величины 5 И р? с по- 
грешностью исходных данных и требованиями к точности аппроксимации, 
приходят к разумному для данной задачи компромиссу. 


Случай 2. т<п. Если все сингулярные числа с, ненулевые, то система 
(6.1.11) отсутствует, а система (6.1.10) принимает вид 


бср ў, К=Ь 2, ..., т. (6.1.16) 
Первые т значений с, выбираются из условия 
с, Е КЕ 25е ТЬ (6.1.17) 
С 


обеспечивая тем самым нулевое значение р? (длины вектора невязки), а ос- 
тальные с, могут выбираться произвольно. Как уже отмечалось, наиболее 
популярный их выбор с, =0, что отвечает минимальной длине векторов с и 


с, но это не является строго обязательным. В общем случае при переходе от 
вектора с к вектору с используется формула, аналогичная (6.1.15): 


п 
с=У.С=со + >, Су. (6.1.18) 
К=т+і 
Если некоторые с; равны нулю, то последние уравнения (6.1.16) принимают 
вид (6.1.11), образуя, как и ранее, ненулевое минимальное значение р? ‚ ако- 


личество свободно задаваемых значений с, в (6.1.18) увеличивается на число 


нулевых су. 


Приведенные ранее рассуждения, включая вид решения в форме (6.1.15) или 
(6.1.18), получили название сингулярный анализ. 


В качестве иллюстрации изложенного обратимся к весьма яркому, приведен- 
ному в книге [14] примеру обработки данных Бюро переписи о населении 
США с 1900 по 1970 годы. 


ров | вю | ве | в | вю [ 5 [ 59 | 9®_ 


е 75994575 | 91972266 |1057106201123203000/131669275|1506973611179323 175203211926 


Эти данные аппроксимировались полиномом второй степени 


0,00) = с +оо + сз? (6.1.19) 
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а о а ее. 


Применение среднеквадратичной аппроксимации без использования сингу- 
лярного разложения с обычной точностью представления данных порядка 
7 десятичных разрядов дало следующие результаты: 


с = —0.372-10°, сә = 0.368.102, сз є 0.905.107, 


а для двойной точности представления порядка 15 десятичных разрядов ре- 
зультаты оказались следующими: 


с = 0.373.10°, сә е 0.402.102, сз ғ 0.108.107. 
Несовпадение имеет место даже по знаку. 


Теперь используем сингулярное разложение. Матрица А системы (6.1.6) в 
соответствии с исходной таблицей имеет размер 8х3 и следующие сингу- 
лярные числа: 


сг = 0.106-10*, с) 0.648.102, с = 0.346-1073, 
Ее недопустимо большое число обусловленности 
сопа(А) = 2% = 21 „0.306.101 
Спи 3 
полностью объясняет приведенные результаты. Используя матрицу с эффек- 


тивным рангом равным двум (например, для значения == 0.6 :10 ), т.е. при- 
ближенно считая оз = 0, значительно уменьшаем число обусловленности до 


сопа(А) = 212 0.177.108 
5 


и обеспечиваем не только очень хорошее совпадение результатов: 


О ағ -0.166:107°, с, =-0.162-10', с; = 0.869-10-3 — обычная точность: 


О а=-0.167.10*, с, =-0.162.10', с, =0.871-10-3 — двойная точность, 
но и ожидаемые много меньшие значения коэффициентов су. 


Приведенный пример убеждает в эффективности использования сингулярно- 
го разложения в подобных случаях. Однако исходная задача могла быть ре- 
шена проще и без столь мощного инструментария, если внимательно была 
бы проанализирована причина плохой обусловленности ее решения. Основой 
всех неприятностей является тот факт, что значения элементов первой строки 
приведенной таблицы относительно близки. 
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Если вместо аппроксимации (6.1.19) использовать следующий полином 
0,00) = с + с, (#1900) + с, (#—1900)?, 


то интервал [1900, 1970] превращается в интервал [0, 70], а число обуслов- 


ленности становится равным сопа(А) = 0.575 :10“. Еще более удачная ап- 


2 
1 — 1935 1935 
еее ре 
О, (1) = с | 0 | { то | 


проксимация 


приводит к интервалу [-3.5, 291 и числу обусловленности сопд(А) = 10.7. 


В использовании сингулярного разложения в обоих случаях нет никакой не- 
обходимости. При этом полезно заметить, что последние аппроксимации ос- 
тались в классе полиномов второй степени. 


6.1.3. Псевдообратная матрица 


При анализе систем линейных алгебраических уравнений 
Ах = (6.1.20) 


в главе 2 предполагалось, что матрица А — квадратная и неособенная, а 
решение в таком случае однозначно записывается через обратную матрицу 


х= АБ. (6.1.21) 


А, если аеқА) = 0 или матрица А прямоугольная, что понимается под реше- 


нием задачи (6.1.20)? Можно ли записать решение в форме, похожей на 
(6.1.21), ичто в таком случае является аналогом обратной матрицы? 


В общем случае под решением (6.1.20) понимается вектор х, минимизирую- 
щий квадрат длины вектора невязки 


(г,г) = (Ах-Ъ, Ах-Ь) ти. 
Если задача решается неоднозначно, то из всего множества решений выбира- 


ется то, которое обладает наименьшей длиной (х| > тіп). При этом реше- 


ние записывается в виде 
х= АЫ, (6.1.22) 
где под А’ понимается исевдообратная матрица. Если матрица А имеет 


-] 
полный столбцовый ранг, то А” = (АТА) АГ. 
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Действительно, для вектора невязки имеем 
(г.г) = (Ах-Ъ,Ах-Ъ)= (Ах, Ах)-2(Ах,Ь) + (Ь,Ъ) = 
= (А7Ах,х )- 2 (АТ) (Б,Ь) > тіп. 
Необходимое условие минимума порождает следующий результат: 


Х 


=2А’Ах-2АТЬ=0, 


х= (АТА) 'АТЬ=А*Ь; А* = (АА) АТ. 
В общем случае псевдообратная матрица может быть определена следующим 
образом. 
Определение. //севдообратной матрицей Мура—Пенроуза, называется мат- 
рица Х = А*, удовлетворяющая следующим четырем условиям: 
О АХА=А; 
О ХАХ=Х; 
СО АХ — симметрическая; 
О ХА — симметрическая. 


Можно показать, что такая матрица Х существует и единственна, и для ее 
построения применяется сингулярное разложение. С этой целью для заданно- 


НЕ 
го числа о определим число с: 


М 8 если с + 0; 
С = 6 (6.1.23) 
0, если с=0. 


Если для матрицы А =с размера 1х1 определить Х как Х = о”, то все четы- 
ре условия очевидно выполняются. Теперь в общем случае для матрицы У 


размера тхи введем матрицу У” размера ихт: 


су 0 0 
о 0 0 0 
и А о... 0 
= 0 0 су}; У = г 
оо 0 
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Здесь иллюстрируется случай т> и, что не является принципиальным. Тогда 


для исходной матрицы А = ОХУ? ее псевдообратная задается формулой 
Х=А* =УЯТО'. 
Действительно, 
АХА = ХУ” УХ ОГ ОХУ! = ОХУ ХУ! – ОХУ! = А; 
ХАХ = УХГОГОХУ УХО" = УХ УУГ! = УГО! = Х, 


а матрицы АХ и ХА очевидно являются симметрическими. Вариант т< л 
иллюстрируется аналогично. Введем обозначения для элементов всех рас- 
сматриваемых матриц: 


Ф + ой в 
А >а,; А > ау; О=и;; У>у.. 
Тогда для а; и а; имеем: 
п Уи, 
а , + _ ИК 
а = У, буи; а= у ——. 
к=] с,*0 Ск 


Как и ранее в методе наименьших квадратов, для уменьшения числа обу- 
словленности и повышения надежности результатов можно ввести эффек- 


тивную псевдообратную матрицу А. С этой целью аналогично (6.1.23) 


введем число с; : 


если с> є; 


о + 


] 

—, 
= 6 

0, в противном случае. 


+ 
Это позволяет задать элементы А, следующим образом: 


УИ р 
а (в)= У и. 


Ср >Е К 


(6.1.24) 


Непосредственной проверкой легко убедиться, что эффективная псевдооб- 
ратная матрица Х = А" удовлетворяет трем последним условиям для А": 

О ХАХ=Х; 

С АХ — симметрическая; 


С ХА — симметрическая, 
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а первое условие выполняется с точностью до є 
|АХА-А|<=. 


Для ненулевого значения = матрица Х, удовлетворяющая этим четырем ус- 
ловиям, может оказаться неединственной. Однако матрица с элементами 
(6.1.24) дополнительно обладает наименьшей нормой Хх] 


6.2. Понятие некорректно 
поставленной задачи 


Среди возникающих на практике задач важное место занимают те, решения 
которых неустойчивы к малым возмущениям исходных данных. Так как ре- 
ально точность исходных данных всегда ограничена, это приводит к неедин- 
ственности решения в рамках заданной погрешности. В таких случаях гово- 
рят о некорректно поставленных задачах. 


Для некоторой количественной задачи введем область "исходных данных" 0 
с элементами ЧЕТ и область "решений" 2, с элементами 2 є 2. При этом 
решение 2 находим по исходным данным и в соответствии с некоторым пра- 
вилом 2 = К(и). Метрические пространства О и 2 могут иметь самую раз- 


личную природу, определяемую постановкой задачи, поэтому для каждого из 
них введем расстояния между элементами р; (щ,и,) и р27(71,72); 


и], 0, Е 0; 2, 2, ЕД. Пусть каждому элементу ои є О отвечает единствен- 
ное решение 2 = А(и); ЕД. 


Определение. Задача определения решения х = А(и) из пространства по 


исходным данным о є называется устойчивой на пространствах (2, 0), 
если 


(У=>0)(35(=) > 0)(ри(щ, и) < 5(=) >р; (д1, 25) <), 
где 21 = (1), 25 = К(и,), ш, и, ЕО; 21, 2 ЕЙ. 


Определение. Задача определения решения 2 из пространства 7, по исход- 
ным данным ао є 0 называется корректно поставленной на метрических про- 
странствах ( 7,, ©), если выполняются следующие два условия: 


О для всякого элемента о є О существует определяемое однозначно реше- 
ние 2є7.; 


О задача устойчива на пространствах (2,, 0). 
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Нарушение любого из этих требований делает задачу некорректно постав- 
ленной. 


Рассмотрим некоторые примеры некорректно поставленных задач. Не очень 
внимательный читатель будет удивлен тем, что в приведенных ‘далее приме- 
рах нет ничего экзотичного. Более того, все рассматриваемые ситуации уже 
встречались в предыдущих главах. Следует обратить внимание на то, что 
превратить задачу из некорректно поставленной в корректную удается чаще 
всего привлечением дополнительной информации о решении. 


Пример 1. Самым "свежим" примером является материал предыдущего раз- 
дела. В задаче (6.1.1) с 4еКА)=0 или для прямоугольной матрицы оказыва- 
ется нарушенным первое условие (единственности решения), особенно при 
введении эффективной псевдообратной матрицы. Справиться с возникающи- 
ми трудностями удается за счет дополнительной информации о решении. На- 
пример, оказывается предпочтение решению с наименьшей нормой. 


Пример 2. Возникновение "комплексов" параметров в задачах минимизации 
функций (см. разд. 5.3 и формулу (5.3.8)). Опять нарушено первое условие, и 
проблема разрешается лишь при использовании дополнительной информа- 
ции о решении. 


Пример 3. Решение систем линейных дифференциальных уравнений 
(х' = Ах), когда одно или несколько собственных значений матрицы А име- 
ет положительную вещественную часть (Кел. > 0). Здесь нарушено второе 
условие (условие устойчивости). Близость решений для {>< не удается 
обеспечить даже при очень малом отличии в начальных условиях. 


Пример 4. Задача численного дифференцирования. Вновь нарушено условие 
устойчивости. В разд. 1.12 уже рассматривался пример двух функций / (х) и 


8(х) 
1. 5 
Лод; во) = Год +9 (м); 
о 48 (х) = 00, сов м»); 
ах ах ах 
когда с ростом величины № обе функции Хх) и (х) становятся друг к другу 


все ближе и ближе, а их производные... все дальше и дальше! Таким образом, 
близость / (х) и 2(х) еще не гарантирует близости их производных. 


Пример 5. Типичным "поставщиком" проблем некорректности являются 
всевозможные так называемые обратные задачи, когда по заданному реше- 
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ж 
нию 2є 7, требуется восстановить исходные данные иЕФ, т.е. ц=А (2). 


Здесь весьма популярным примером из практики моделирования различных 
систем является задача параметрической идентификации, в которой необхо- 
димо подобрать параметры модели так, чтобы результаты моделирования 
были максимально близки к экспериментальным данным, взятым с реального 
объекта. 


Более глубокое знакомство с примерами некорректных задач, методами их 
решения и многочисленными проблемами, возникающими в этой области, 
можно реализовать по книге [45]. 


6.3. Свойства жестких систем 
дифференциальных уравнений 


Введенное в разд. 4.3 понятие жесткой системы носило описательный и не 
вполне строгий характер. Наиболее важным моментом было существование 
двух принципиально различных участков решения: начального пограничного 
слоя малой продолжительности тис с большими производными и значитель- 


но большего (7 > тпс) второго участка со сравнительно малыми производ- 


ными, где решение носит относительно спокойный характер. Для линейных 
жестких систем вида (4.3.1) типична ситуация, когда матрица А плохо обу- 
словлена, а для нелинейных жестких систем 


Ах 
е (6.3.1) 


о ОТ 
плохо обусловленной часто оказывается матрица Якоби > на решении. Та- 


кое описание содержит целый ряд неопределенностей. Что такое "большие" и 
"малые" производные? Каким должно быть соотношение между производ- 
ными внутри и вне пограничного слоя, чтобы можно было судить о наличии 
жесткости? Ответ на эти вопросы не однозначен и определяется решаемой 


задачей. Имеется полная аналогия, например, с числами обусловленности 
сопа(А) в (2.1.1) или К(А) 


тах |А | 


; КА) = ———; 


сопа(А ) = [АА пп | 
іп 


сопа(А) > (А). 
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Обычно говорят о плохой обусловленности матрицы, если (А) »>1. Однако 
в каждом конкретном случае разные величины К(А) могут считаться боль- 
Шими. 


В предлагаемом далее определении также приходится мириться с такого рода 
неопределенностью. Малая продолжительность тпс пограничного слоя по 


сравнению с длиной полного промежутка наблюдения решения [а, Ь] зада- 


ется неравенством 
тис «2-а, (6.3.2) 


а значения производных вне пограничного слоя полагаются меньшими, чем 
значения внутри него, в № раз, где №» І]. 


Линеаризация правой части системы (6.3.1) в окрестности начальной точ- 
КИ Хо 


(0х) = 0,ху) + (хо) (хдд). (6.3.3) 


позволяет убедиться в том, что для возникновения больших производных 
внутри пограничного слоя матрица Якоби системы (6.3.1) должна иметь 
большие по модулю собственные значения. Производные компонентов 


хб (Г) вектора х(/) 


Г 
хб) = (хх ),...х 0) 
могут достигать величин порядка 


Ё тах 
Е, +Т] 


хи), 


где значение /, определяется неравенствами 


ОЁ ОЁ 
0<25р| —- |< |—, 6.3.4 
15) Ох ( ) 
д 9 
122) — максимальный модуль собственных значений матрицы Якоби 
Х 


(спектральный радиус), |*| — принятая норма матрицы. Поэтому вне погра- 


ничного слоя потребуем, чтобы значения производных были меньше в № раз. 


И кое-что еще... 197 


Важно отметить, что принадлежность системы дифференциальных уравне- 
ний (6.3.1) к жестким на промежутке [а, | предполагает проявление харак- 
терных свойств жесткости на любом отрезке [1, 0 +Т] внутри [а, 6]. Это, в 


первую очередь, указывает на потенциальную возможность возникновения 
пограничного слоя, какую бы точку це [а, Б} мы ни выбрали за начальную. 


Необходимость такого свойства иллюстрирует следующий пример: 


а (і). 0) ге[0,1, х0) =0, 000) =-10%ехр(-10*)-1. (63.5) 


Решение этого уравнения 
і 
х(1) = -ехр [о(т)ат +1 = ехр(10 : ехр(-10*1) – 1 0) ‚ехр(-—г)-+1 
0 


внешне очень похоже на решение жесткого уравнения. Есть и начальный 
участок с большими производными, и последующее "плавное" изменение 
х(г). Однако величина о(/) остается большой по модулю только в малой ок- 


рестности начальной нулевой точки. Уже для любой начальной точки 
іу > 0.001 величина (Г) практически равна —1, и на отрезке [0, 1] уравнение 


(6.3.6) не является жестким. 


Определение. Система обыкновенных дифференциальных уравнений (6.3.1) 
называется жесткой на отрезке изменения независимой переменной [а, 6], 


если при любом векторе начальных значений х(/џ) и на любом отрезке 
[10, р +Т | С [а, }| найдутся такие числа тпс, 2, №, удовлетворяющие (6.3.2) 


и (6.3.4), что справедливы неравенства 


ах) 


а тах х® (1), АЕ 2. даа: 6 
М џи, 1+Т) (6.3.6) 


> +Тпс 
10 +тдс 4510) +Т, М» 1. 


Если начальные условия таковы, что пограничный слой явно присутствует, 
то величина М№ дает представление о том, во сколько раз уменьшились произ- 
водные за пограничным слоем. 


Важным моментом этого определения является неразрывная связь понятия 
жесткости системы (6.3.1) с величиной промежутка наблюдения решения, 


отражаемая неравенством (6.3.2). Если жесткую на [а, Ь] систему рассмот- 
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реть на промежутке [а, а+т пс], включающем только пограничный слой, то 


в этом случае ее нельзя признать жесткой, т. к. никакого различия в характе- 
ре поведения решения не наблюдается. С другой стороны, система линейных 
уравнений 


ах 
— = Ах +Ї(/ 6.3.7 
ра (1) ( ) 


с матрицей второго порядка и собственными значениями А = 1, А; = –2 


имеет своими частными решениями две экспоненты с достаточно близкими 
показателями и не является жесткой на промежутке [0, 1]. Однако, например, 
на промежутке [0, 100] эта система уже может быть жесткой, если #(Г) — 
медленно изменяющаяся функция. Здесь различие проявляется между част- 


ными решениями, выраженными этими экспонентами, и частным решением 
неоднородного уравнения, определяемым видом #(/). 


В общем случае поведение решения нелинейных систем может быть очень 
сложным. Например, система может быть жесткой на одних участках изме- 
нения независимой переменной и нежесткой — на других. 


Подводя итоги сказанному, сформулируем некоторые свойства жестких сис- 
тем. Первоначально обратимся к линейным системам с постоянной матрицей 


ах 
— = Ах. 3. 
г. х (6.3.8) 


Свойство 1. Для жестких систем "почти всегда" существуют два участка ре- 
шения с принципиально различным характером поведения его составляю- 
щих, причем продолжительность первого участка значительно меньше, чем 


второго (тпс «Ь-а). "Почти всегда" — потому, что можно подобрать на- 


чальные условия с целью полного устранения пограничного слоя, хотя спе- 
цифика уравнений, естественно, не изменится. 


В общем случае пограничный слой может иметь достаточно сложную струк- 
туру, если решение в нем, в свою очередь, описывается комбинацией экспо- 
нент. Так для системы (6.3.8) с матрицей третьего порядка и собственными 
значениями 


м =-10°, м =-10°, м =-5 ғє[0,1] 
пограничный слой длительностью тпс ~ 0.003 – 0.005 неоднороден и, в свою 


Т -5 
очередь, разделяется на два участка, первый из которых тпс! -3.10` значи- 


тельно меньше второго (тпс « тпс). 
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Свойство 2. Для линейной системы (6.3.8) собственные значения А, и соб- 


ственные векторы матрицы А полностью определяют характер частных ре- 
шений. Поэтому естественно выявить те требования, которым должны удов- 
летворять Л, в жесткой системе, считая для простоты, что кратные 


собственные значения отсутствуют. 
Принято считать, что в жесткой системе (6.3.8) матрица А обладает боль- 
шим числом обусловленности, т. е. К(А)>»1. На практике это часто имеет 


место, но не является обязательным. Исключением, например, является рас- 
смотренный случай группы близких собственных значений 


(А =-Ь А =-2) и большого промежутка наблюдения решения 


(1 Е [0, 100] ‚ Из плохой обусловленности А жесткость (6.3.8) также следует 


далеко не всегда. Это нетрудно заметить уже на системе третьего порядка с 
собственными значениями 


А. = — 1, А з ==| +10“ 1, 1[Е[0,1]. 


Величина К(А) > 10“, а решение (6.3.8) не удовлетворяет условию (6.3.6). На 


всем отрезке [0, 1] наблюдается сильно осциллирующее решение, и никакого 
противоречия между производными на отдельных участках не наблюдается. 


Не выдерживает критики и предложение всегда считать жесткой систему, у 
которой собственные значения имеют сильно отличающиеся вещественные 
части Ке(А; ) 


тах |Ке(%)| 
А) = |. 
КА) піке > 


Это требование также не всегда гарантирует условие (6.3.6) медленного из- 
менения решения вне пограничного слоя, что можно видеть на примере 


№ =-10*, Аз=-1+10.1, 1&[0,1. 


Кроме того, определяя свойство жесткости, при любом наборе собственных 
значений нельзя игнорировать длину промежутка наблюдения решения. 


Какими же свойствами должны обладать А, в жесткой системе? 


Введем следующие обозначения: 


Лк = 0, +10, с; = Ке(л,), 0 =1т(А), ЗР 
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и запишем решение (6.3.8) через матричную экспоненту 
х(/) = е! .х(0). 


Так как неравенство (6.3.6) должно выполняться для любых начальных усло- 
вий, выберем х(0) так, чтобы /-ый компонент вектора решения имел вид: 


хо (г) = С, ехр(о г): соѕ(оџѓ + Фу). (6.3.9) 
Пусть первоначально ао, <0. Выбирая С, =1 и Фф, =0, получаем решение с 


пах | (1 = х (0) =1. Дифференцируя (6.3.9), имеем 
1 


(0 (у 
ах (0) = |А |ехр(о) - с03(6 1 + фу ), ФА -агсір 26. 
а! 0 


Неравенство (6.3.6) при всех # > тис требует выполнение условия 


рыы|екр(Ве (2 )пс) =, 1. = тах [4 №>1. (6.3.10) 


Теперь рассмотрим случай о, > 0. Выберем начальные условия таким обра- 
зом, чтобы максимум модуля /-ого компонента решения достигался в точке 7. 
При этом Су =ехр (- Ке(^ )т). Тогда для производной х(0 (1) получим 


ах (1) 
а! 


Для выполнения (6.3.6) при всех {> тус необходимо, чтобы 


= «ехр(Ве(^,)(1-Т))-соз (в! + $). 


І, 
№5. (6.3.11) 


Объединяя условия (6.3.10) и (6.3.11), получаем необходимые требования на 
собственные значения в жесткой системе (6.3.8): 


А. |ехр(ке(л., )тпс)< = ‚если Ке(^,)<0; 


|, если Ҝе(А,)>20; (6.3.12) 


І = тах|№|, №21, трс «7. 
р 


И кое-что еще... | 201 


Непосредственно из этих условий следует, что в жесткой системе не может 
быть больших по модулю собственных значений (порядка /) с положитель- 
ной вещественной частью. Для собственных значений, имеющих величины 
модуля порядка [, должно иметь место неравенство 


ехр(ке( пе), №», 


т. е. они должны обладать большими по модулю отрицательными вещест- 
венными частями. 

Важным моментом в формулах (6.3.12) является и то, что требования на соб- 
ственные значения связаны с промежутком наблюдения решения (тпс < Г) | 


Наиболее типичен случай линейной жесткой системы, когда собственные 
значения матрицы отчетливо разделяются по величине их модулей на две 
группы. При этом собственные значения А, первой группы с большими мо- 


дулями определяют поведение решения в пограничном слое, и соответст- 
вующие им составляющие быстро убывают, а А, второй группы с малыми 


модулями характеризуют поведение решения при {> тпс. Однако возможны 


и другие случаи. Например, собственные значения могут быть расположены 
на вещественной оси достаточно равномерно и А(А)>>1. Такая система мо- 


жет быть жесткой, если имеет место (6.3.12). 


Свойство 3. Если среди собственных значений А, есть кратные, то, учиты- 


вая необходимость выполнения (6.3.6) для любых начальных условий, анало- 
гично предыдущему потребуем выполнения (6.3.6) для решения 


х (2) = С; ехр(о 7): соѕ(оџі + ф)Р, (0), (6.3.13) 


где Р,_1(/) — произвольный полином (5 – 1)-ой степени, 5 — кратность соб- 
ственного значения А, . 


/ 
Значения С; и ф; выбираются при условии пах | 00) =1. Тогда из нера- 
«О, 


получаем требование на жорданову форму (А) мат- 
1>ТИС 


рицы А жесткой системы: 


|(А)ехр((А)!] (6.3.14) 


Г 
< 5 
211 № 
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т. к. строки матрицы, стоящей в левой части неравенства (6.3.14), являются 
различными вариантами производных (6.3.13). 

Свойство 4. В качестве еще одного свойства рассмотрим поведение фунда- 
ментальной матрицы решений ехр(А(!—1)) системы (6.3.8) при изменении 


і влево и вправо от точки 10: 


При изменении / вправо от точки к после прохождения пограничного слоя 
быстроизменяющиеся составляющие решения практически исчезают, и нор- 
ма производной фундаментальной матрицы А ехр(А(г –,))| становится от- 


носительно малой. Об этом свидетельствует и неравенство (6.3.14) для ее 
жордановой формы. 


В то же время изменение / влево от ќу приводит к тому, что определяющую 
роль начинают выполнять именно быстроизменяющиеся экспоненты. Норма 
производной фундаментальной матрицы начинает расти экспоненциально с 
достаточно большим показателем. Такое поведение нормы является ярким 
признаком жесткости (6.3.8). 


Свойство 5. Рассмотрим теперь, как связана жесткость системы (6.3.8) с же- 
сткостью неоднородной системы (6.3.7). Решение (6.3.7) может быть записа- 
но в виде 


х(1) =ехр(А(7–10))(х(0) Фо) + (0), (6.3.15) 
где ф(/) — частное решение (6.3.7), определяемое видом функции #(/). 


Пусть система (6.3.7) — жесткая. Тогда требование (6.3.6) должно выпол- 
няться при любых начальных условиях. Выбирая в частном случае 


х(/0) = Ф(1)), убеждаемся, что условие (6.3.6) должно выполняться не только 
для самого вектора х(/), но и для его обоих слагаемых в (6.3.15) в отдельно- 


сти. А так как первое слагаемое в (6.3.15) является решением однородной 
системы (6.3.8), то эта однородная система должна быть жесткой. 


Таким образом, из жесткости неоднородной системы (6.3.7) следует жест- 
кость (6.3.8). Это утверждение свидетельствует о том, что жесткость является 
внутренним свойством линейной системы и не может появиться только бла- 
годаря изменениям функции #(/). 


Свойство 6. Рассмотрим поведение решения жесткой системы вне погранич- 
ного слоя. Пусть среди т собственных значений Лк первые 5 значений име- 
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имеют большие модули, а отвечающие им частные решения быстро убывают 
в пределах пограничного слоя: 


ехр(Ке(^, )тпс ) < о Ора (6.3.16) 


Записывая решение однородной системы (6.3.8) по формуле Лагранжа — 
Сильвестра, с учетом равенства (13.16) получаем 


т 
А А і р 
к) еко = Уеа (7х) (6.3.17) 
1=1 
где и, иу, — собственные векторы матриц А и А! соответственно. 
К ГА р р 


Как показано в разд. 113.3, для этих векторов, относящихся к различным соб- 
ственным значениям, имеет место равенство: 


Уи, =0, если Ар + А. ;. 


Поэтому ДЛЯ УГ х справедливо следующее выражение: 


Г 
Т 
угх = уге! ху (6) "| хо =е^ Ухо: Ё=1, 2, 4..5. 


Учитывая неравенство (6.3.16), вне пограничного слоя имеем почти точное 
равенство: 


уїх=0;&= 1, 2,...„ 5 (6.3.18) 
Если среди А, есть кратные, то для построения аналогичных равенств ис- 
пользуются векторы, приводящие А’ к жордановой форме. 
Таким образом, для жесткой системы дифференциальных уравнений (6.3.8) 


вне пограничного слоя между компонентами вектора х(Г) устанавливаются 


почти точные алгебраические связи. Их число отвечает количеству быстро 
убывающих частных решений 5. Поэтому, выражая 5-й компонент вектора 
х(і) через остальные, приходим к выводу, что вне пограничного слоя реше- 


ние жесткой системы может быть описано решением системы меньшей раз- 
мерности, уже не являющейся жесткой. 


Вопросы практического построения коэффициентов алгебраических связей 
вида (6.3.18) и распространения этого свойства на нелинейные системы под- 
робно рассматриваются в книге [40]. 
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Многие из рассмотренных свойств решений линейной жесткой системы 
(6.3.8) с постоянными коэффициентами легко перенести на системы с пере- 
менной матрицей 


Фх 
=== А()-х (6.3.19) 


Однако судить о ее жесткости по собственным значениям А, ({) матрицы 
А(Г) можно, если собственные векторы А (і) изменяются не слишком силь- 
но. В общем случае А, (і) и характеристики, определяющие рост решения 
(6.3.19), могут радикально отличаться. Так, например, для матрицы А(/) 
третьего порядка 
–1+100со5200/ 100(1 – ѕ1п 200/) 0 
А(/) = —100(1 + зщ 200/) —(1+100соѕ 2007) О |, [0,1] 
1200(соѕ100/ + ѕіп 1007) 1200(соѕ100/ – ѕіп100/) –501 


собственные значения, полученные из уравнения 
деќА - АЕ) = 0, 
постоянны на всем отрезке решения 
№ = 501, №=-1, А=-1. 


Линейную систему (6.3.8) с постоянной матрицей, обладающую такими соб- 
ственными значениями, следует считать жесткой при ЕЕ [0, 1]. Однако сис- 


тема (6.3.19) не может быть отнесена к категории жестких, что легко видеть 
из ее общего решения с быстрорастущими экспонентами, имеющими поло- 
жительный показатель: 


х0 (р) = Сре?! с0$100#+ Сет! 51001, 
х2) (р) = Се?" ѕіп100 + Се 0" соз1001, 
х (2) = 28е? + ЗСзе 19 + Суе 


где постоянные Су, С, Сз определяются из начальных условий. 


ПРИЛОЖЕНИЯ 


ПРИЛОЖЕНИЕ 1 


Конечные разности, суммы, 
разностные уравнения 


П1.1. Конечные разности 
и их свойства 


Пусть значения функции /(х) известны лишь для дискретного множества 


значений независимой переменной х: 


ИНЕТЕ 
ГО) | Лоо) | Хоа) | ХО) ВЕ 


В данном разделе значения х, будем полагать равноотстоящими, т. е. 


хр = хә +Кй (ху, А — некоторые фиксированные числа, К — любое целое 
число). Величину Й называют шагом таблицы. Подобно тому как поведение 
непрерывной и дифференцируемой функции (х) характеризуют дифферен- 
циал и производные, для таблично заданной функции вводят понятие конеч- 
ной разности. Выражение 


А, (ж ) Оо +) Лк) = (хо + (+ А) (хо +) (ПЛ) 


называют конечной разностью (разностным оператором) первого порядка. 
Так как величины хо и й постоянны для рассматриваемой таблицы, целесо- 


образно без нарушения общности от переменной х, = хо +Ай перейти к но- 


вой А = 


Рр 
А я ° которая принимает целые значения 0, 1, .., т-1. Тогда 
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функция /(х) становится функцией целочисленной переменной /(/), а в 


операторе А,/(х,) будем опускать индекс Л 


АЮ) = ДК, = (6+1) - АЮ) = а-о А = РОЮ). 


Теперь обратимся к некоторым свойствам конечных разностей, отмечая тес- 
ную связь между ними и свойствами производных, что является основой 
большинства конечноразностных выражений: 


О Ла =0, а = соп; 
О Л(оу(к)) = олук); 
О Л(Л() + (0) = АИК) + Де(). 


Эти три свойства не требуют доказательств в силу их элементарности. Чет- 
вертое свойство необходимо пояснить 


А(ЛО) 5(®)) = 0+ 1) (6 +1) – 70)2(Ю) = 
= (К +1) +1) – ХС) (К +1) + 8+0 – ЛЮ) = 
= АД (К): (6+1) + Л(К)ДЕ(К). 
Его можно записать и в таком виде 


А(ЛО) 8(®)) = А8(®)- (+1) + (КДУ). 


Этот результат, с одной стороны, продолжает цепь аналогий со свойствами 
производных, т. к. формула разности произведения напоминает формулу 
производной произведения: 


(1(х)8(х)} = 7 О)в (х) + ГО) (х), 


а, с другой стороны, конечность приращения аргумента подчеркивает раз- 
ЛИЧИЯ. 


Следующая формула имеет не столь лаконичный вид, который имеет анало- 
гичная формула для производной, хотя первое слагаемое совпадает: 


ЛЕ = (К +1) = 5657. 282962 гй (П1.2) 


Однако ее результат позволяет сформулировать свойство конечной разности, 
созвучное свойству производной. 


Конечная разность от полинома степени 5 равна полиному степени 5 – 1 
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Аналогично тому, как в непрерывном случае строилась таблица производ- 
ных, рассмотрим конечные разности для наиболее популярных функций. 


Ла“ =аН - а‘ = ака -1), 


Азт (ка) = зт((& + )о) – ѕіп(ко) = 25іп о ка + = 


А сс ка – = = со ка + я — сс ка – = = —2511 [5 ока) 
2 2 2 2 


00 | 


Е И 
+1 К АЕТ) 
А О у аук о үк. _ “| _ 
А(-1) со ка = 1) 9 (1) со5 ка Э 
= (1) СС + я + со ка =] = (2) доз] $ |сов(ка). 


х 


о 
р 


Представляет интерес первая формула из представленных для а=2: 


до" Воры": Она показывает, что число 2 в исчислении конечных 

разностей в некотором отношении играет ту же роль, что и число е в диффе- 
! 

ренциальном исчислении: (=) =е*. Очевидно, что представленный пере- 


чень функций легко может быть продолжен. Так особую роль в теории ко- 
нечных разностей играет факториальный многочлен или обобщенная 
разность: 


Е" = АКИ -2)..(Е-п+1), 


а Зы О 
К(Е +1) + 2)..(К+п-1) 

Конечные разности в этом случае имеют вид: 
АК = ПАН, АКГ" = и", 


что аналогично формуле дифференцирования обычной степени в непрерыв- 
ном анализе: 
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Подобно дифференциалам и производным высокого порядка соответствую- 
щие конечные разности строятся на основе рекуррентных соотношений. Так 
конечная разность порядка 5+1 определяется следующим образом: 


АЗ АА) АЛА. 


В частности, для конечных разностей второго и третьего порядка получаем 
РЕ с 25 г 
А Ль = А(А/,)=АЛ -Ај = јә — Јен — Лен + № = +2 – 23 + Л 1 


АР = А(А2У = А27 А27 = Лаз ЗЛ +З Л. 


Легко заметить в этих формулах появление коэффициентов бинома Ньютона 
С“ . По индукции можно показать, что эта тенденция в выражении конечных 
разностей через значения функции сохраняется: 


Ау, = суси Е (П1.3) 


П1.2. Разделенные разности и их свойства 


Для равноотстоящих узлов таблицы конечные разности являются хорошей 
характеристикой изменения функции, аналогичной производной для непре- 
рывного случая. При произвольном расположении узлов таблицы: 


ТЕ 
Л(х) | Лоо) | ЛО) Ло) Р) 


целесообразно ввести понятие разделенной разности. Разделенные разности 
(или разностные отношения) нулевого порядка совпадают со значениями 
функции, а разности первого порядка определяются равенством 


А) 7 О ) | 


(5х) = Зав (П1.4) 
В частности, для и=1 и и= 2 имеем 
ОЕ перу И, 


Хр №0 х) – 
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Аналогично строятся разделенные разности высших порядков. При этом разно- 

сти А-го порядка определяются через разности (А – 1 )-го порядка по формулам 

)= Р(х; Хә; ...5 х) — (х0; хрх) 
Хк ХӘ 


Ў (05 15-5 № (ПІ.5) 


В частности имеем для разностей второго порядка 
Хорх) Ох) 


Хк+2 — № 


Ак; Хин Хин) = 


и разностей третьего порядка 
(хыр хрњо5 раз) = ЛОХ) 


Хк+3 — ХК 


ХХ Хз) = 


На практике вычисление разделенных разностей производится в рамках сле- 
дующей таблицы, где появление новой разделенной разности более высокого 
порядка связано с построением еще одной диагонали: 


Е ООО 
С ООО МООИ 
О О ОИ ПО 


Подобно формуле (111.3) разделенные разности могут быть выражены через 
значения функции в различных точках. По индукции легко убедиться в спра- 
ведливости следующей формулы для разности А-го порядка 


РТ Е ел, 
О а О 
Л (х) 
(Хы (ен Хо). (ны Хк) 
Я) Е (П1.6) 
(х х) — Хад) Хы — Хнык) 
о: Е ДЕЯ), 
(5х5 5ха) = Та 


[ж } 
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Непосредственно из этой формулы следует важное свойство разделенных 
разностей: они являются симметричными функциями своих аргументов. 


В частности, /(х„; хи) = (х,_1;х,). 


Если в исходной таблице узлы равноотстоящие, то для описания поведения 
таблично заданной функции могут быть привлечены как разделенные разно- 
сти, так и конечные. Установим связь между ними для этого случая. 


Ло) = Л (>) _ А 
Хр 2; р | 
А 


вв А? 
2А 212. 


Ух) = 


(ххх) = 
По индукции легко устанавливается, что 


А“) 
(ханхар) = а (П1.7) 


П1.3. Суммирование функций 


Обратимся к уравнению 

АЕ(А) = ф(к). (П1.8) 
До сих пор мы занимались прямой задачей: по заданной функции Ё(А) не- 
обходимо определить функцию $(К). Теперь обратимся к обратной задаче: 


по заданной функции Ф(А) необходимо восстановить функцию Р(А). Ситуа- 


ция подобна задаче нахождения функции /(х) по ее производной Й(х). 


Р(х) = (х). 


В случае ее решения появляется возможность для вычисления интеграла 
Ь Б 
[АО)ах = | 7 О)ах = Ў) – Уа). (11.9) 


Аналогично, решение обратной задачи (П1.8) позволяет, в свою очередь, ус- 
пешно решать задачу суммирования функции Ф(А). 
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Запишем уравнение (П1.8) последовательно для А = т, т +1,..., М-Г и ре- 


зультаты просуммируем: 
Е(т +1) - Е(т) = (т), 
Е(т+2)-Е(т+1) =Ф(т+1), 
Е(т+3)-Е(т+2)=Ф(т+2), 


ЕСМ) - Е(М –1) = ФМ – 1); 


№-] 
Е(№)-Е(т)= У Ф(Ю) 


К=т 
Иными словами 
М-1 
У, Ф(®) = 5 АЕ(Ю) = Е(М№) – Е(т). (П1.10) 
К=т 


Эта формула является дискретным аналогом формулы Ньютона — Лейбница 
(П1.9). В дополнение следует заметить, что она выводилась в предположе- 
нии, что М№> м. 


Простейшие формулы интегрирования получаются интегрированием табли- 
цы производных. Например, 


т+і 


(и) от) > те (т 1) Ја = риа, 


Аналогично, обращаясь к таблице конечных разностей, получаем 


а" а") 
Ла“ =а к(а –1) Е У дй Уа (а-1) => Уа = ——————, 


К=т К=т а – 1 


Второй пример: 


Авіп(да) = ѕіп((6 + о) ~ ѕіп(ка) = 2з | ка) 


оа). Аз ( Ха) Е Ў с кано а). ѕіп( мос) — ѕіп( ро) 
—_ П. БИРУ а 


2+5. К=р 258 
2 2 
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Обращая и другие формулы разностей, можно построить таблицу сумм, на- 
поминающую таблицу простейших интегралов. 


Весьма популярным приемом в интегральном исчислении является также 
интегрирование по частям. Его аналогом в дискретном случае является сум- 
мирование по частям. 


Обратимся сначала к интегралам. Введем три функции — и(/), у(/) и ОФ: 


(О ое, 
0 


а затем продифференцируем произведение И(Г)у(Ё): 


470 ро иЗ 


> 0(г)у(2)) = У + О(1) —— = и(г)у(г) + О) —— 


Перегруппируем члены равенства и проинтегрируем от а до 2: 


монон А 0(г)у(г)) )а– о ИЗ 
(ПІ.11) 
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Теперь обратимся к суммированию по частям. Аналогично введем три функ- 
ции — (К), у(К) и СА): 


М 


| 
> 


(К) = > и(р. 


1 
Учитывая, что 


АС(А) = О(А + 1) - О(к) = и(к +1), 
М 
У А(О(К)у(А)) = ОСМ ++ –- О(руу(р), 
к= р 


воспользуемся ранее полученной формулой конечной разности для произве- 
дения 


А(О(0)У(Ю)) = + АО) + О(Ю)ЛУ(Ю) = у( + Пы + 1) + (ЮДУЮ). 


Перегруппируем члены этого равенства и просуммируем обе его части: 


М к= М+1 М 
> и(к + 1)у(к +1) =И(®у(Е) - >, ФА). (П1.12) 
к= р К = р к= р 
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Это и есть формула суммирования по частям или формула Абеля. Можно ис- 
ключить из нее ((К), выразив эту функцию через и(К): 


М [К 
Уз 2, ко аю 


К == 
ия к=р\1=0 


>. и(к + 1)у(6 +1) = р ко (К) 
і=0 


+ ] 
К=р р 


Представляется весьма полезным сравнение формул (П1.11) и (01.12). 


Обратимся к самому популярному примеру суммирования на основе форму- 
лы Абеля. Требуется найти сумму 


Вводя обозначения и(К) = акі и У(К) =А-1 и вычисляя (А): 


К к | д"! 1 
И(К= уи) = Уа = — | 
і=0 і=0 а а-| 
с учетом Ду(А)=1 непосредственно по (ПІ.12) получаем 
М МЕР: =. № +1 _ 
о в," 
к=] а – | 1а а – 1 
Ма. М №+] М+1 _ 
об. М 0+ ЕЕ а= 2 МА. 
а а-1 а(а-1) (а-1); а-| (а-1)* 


П1.4. Разностные уравнения 


Первоначально обратимся к дифференциальным уравнениям. Соотношение 
Е (4520), 2'(1),... 2) 0) =. 


где { — независимая переменная, функция ГР задана, функция 2(/) — иско- 


мая, называется дифференциальным уравнением порядка 5. При этом урав- 
нение может быть разрешено относительно старшей производной 


29 (0 = 0, 0, 20), .., О (11.13) 


Порядок уравнения 5$, определяемый номером старшей производной, являет- 
ся важной характеристикой уравнения (111.13). Так он определяет количество 
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начальных условий, необходимых для однозначного решения (П1.13). Если 
дифференциальное уравнение является линейным относительно функции 
2(1) и ее производных, то величина 5 задает количество линейно независи- 


мых решений ит. д. 


Рассмотрим разностный аналог дифференциального уравнения 
Е(® 700), У, АУФ), ., АУ Ю)) = 0, (11.14) 


где К — независимая целочисленная переменная, функция Е задана, функ- 
ция / (А) — искомая. 


Казалось бы, логично считать порядок этого уравнения равным 5, руковод- 
ствуясь номером старшей конечной разности, как это было с производными в 
уравнении (111.13). Рассмотрим, однако, следующий пример: 


24° +3 Д-=0, р = УЮ). 


Выразим все конечные разности через значения функции в различных точ- 
ках, руководствуясь уравнением (11.3): 


(Лаз За + ЗА Л) +3 (а 2+), =0, 
2+3 Зз =0. 


Задаваясь только одним начальным условием Јо (вместо ожидаемых трех) и 


(01.15) 


последовательно полагая в (11.15) значение А =-2, –1, 0, |, ..., шаг за шагом 
воспроизводим /; для любого значения К. Здесь лежит глубокое различие 
между дифференциальными и разностными уравнениями. Легко заметить, 
что эффект снижения ожидаемого порядка уравнения произошел за счет со- 
кращения слагаемых /; и Л! в (П1.15). По этой причине в общем случае 
для определения порядка разностного уравнения будем выражать все конеч- 
ные разности через значения функции. Тогда после всех упрощений порядок 
разностного уравнения будет определяться разностью между наибольшим и 
наименьшим значениями аргумента функции (А). В дальнейшем будем за- 


писывать разностные уравнения в виде 
Фк, 70), (к +1,.., У +)) =0 


или в виде, разрешенном относительно функции с наибольшим значением 
аргумента 


РК +5) = Ф (А, (0), ..., +5 1)). (П1.16) 


Приложение 1. Конечные разности, суммы, разностные уравнения 217 


Видно, что оба эти уравнения имеют порядок 5 = (& + 5) – 5. Для их одно- 
значного решения необходимо задать 5 начальных условий /(0), Х(1), 


(5-2), (5-1. 


Перейдем к решению уравнения (111.16). Для дифференциального уравнения 
(П1.13) традиционно большое внимание уделяется теоремам существования 
и единственности решения. Для весьма узкого класса этих уравнений удается 
получить аналитическое решение. Иное положение дел имеет место для 
(111.16). Последовательно полагаем здесь А =0, 1, 2, ... 


1 (5) = Ф (0, 1(0),..., 15-1), 
(5+0) =Ф(1, Г а),..., (5), 
1($+2)=Ф, (2, 7(2),..., 1($+1)}, 


и получаем решение для всех целых значений аргумента. Такое построение 
решения называют иошаговым методом решения разностного уравнения, 
который всегда дает решение, когда заданы 5 начальных условий. Пошаго- 
вый метод совместно с начальными условиями обеспечивает существование 
и единственность решения начальной задачи для разностного уравнения 
(аналог задачи Коши для дифференциального уравнения). Важно заметить, 
что этот метод легко и эффективно реализуется при программировании на 
компьютере. 


Наличие такого универсального подхода к решению (П1.16) не снижает ак- 
Туальности постановки задачи аналитического решения (111.16), хотя бы для 
некоторых уравнений частного вида. Это, в частности, позволило бы при не- 
обходимости вычислять непосредственно, например, /(2007), минуя обяза- 


тельное вычисление (1), ..., }(2006) при пошаговом методе. К числу таких 


уравнений, допускающих построение аналитического решения, относятся 
линейные уравнения, в частности, с постоянными коэффициентами. 


П1.4.1. Линейное разностное уравнение 
первого порядка 


Обратимся к уравнению 


+=) у(К) + &(®), — У(0)= уо, (П1.17) 
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где (К) и Б(А) — заданные функции К, у(К) — искомая функция. Если 
2(К)=0, уравнение называется однородным, в противном случае — неодно- 
родным. Однородное уравнение имеет вид: 


и(Е +1) = (К)и(К), и(0)=щ. 
Воспользуемся пошаговым методом: 
и(1) =5(0) що, 
и(2) = Би (1) = 6(0)Ь(1)и, 
и(3) = (2)и(2) = Б(0)2(1)2(2)иџ, 


п-| 
и(п) = Б(п – 1)и(и —Т) = 5(0)Ь()...Б (и – иу = | Е! мы ио. 
к=0 


Если, в частности, 5(К) = сопѕї = Ё, то решение имеет вид и(и) = Б”и,. 
Решение неоднородного уравнения будем искать в виде 
У(Е) = и(®)у(Е), 


где и(К) — решение однородного уравнения, а у(&) — произвольная функ- 


ция. Подставим искомый вид решения в уравнение (П1.17): 
и(А + 1)у(А +1) =Б(К)и(К)у(К) + =(К). 
Выполним очевидные преобразования: 


и(Е +1) +1) -и( +1) + (+ Пу (А) – КиК) = (К), 
и(к +1) АУ) + [ик +1)- (Ки (К) (К) = &(®). 


В квадратных скобках стоит однородное уравнение, в которое подставлено 
его решение, что обращает скобку в ноль, и тогда 


Лук) =и (+1) 2(Ю). 


Просуммируем это равенство от 0 до & ~ 1: 


К 
у(Е) = (0) + Уи '(1+1)8(0. 
1=0 
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к-1 
Подставим полученное в у(К), учитывая, что и(К)= | Е! као) 
Х=0 


У) = и(Е)у(К) = 


К к] к= г 
П БО |0 + | |] о} >, А во | ио (Ж) = 


х= 0 х= 0 х= 0 0 (П1.18) 
8 Г х 9, 

й но У(0) + >, [д 10) &(х) |. 
х=0 х=0 А=0 


Для уравнения с постоянными коэффициентами, когда Р(Х) = сопѕї = Б, ре- 


шение имеет вид: 


А х—1 ак ыы к-у] к ра х Е 
у) =Ь Р-У 8(х) |= уо 6 а(х) = Бу УБЕ (Е-х-1. 


х=0 х=0 х=0 
Если дополнительно 2(К)= сопѕї = е, то 


_Ь* 
ПІ.1 
р 8. (П1.19) 


УЕ = Б* о-на Б! у0)+= 


х=0 


Как известно, решение линейного дифференциального уравнения 


42(1 
=2 )а()20) +80), 20) = 20 
имеет вид 
Гада 1 ав 
2(1) =е° 20 [е о #(т)ат |. 


(0 
Переписав решение линейного разностного уравнения 


4 
м0) кт с Я 50) 
У(К)=е *° | (0) + 2, №0 (у) |, 


получим еще одно звено в цепочке аналогий двух исчислений. 


8 Зак. 3418 
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П1.4.2. Линейные разностные уравнения 
порядка выше первого 
Перейдем к уравнению 5-го порядка: 
УК +5) + (КУ +5 1) +5 (КУ +5-2)+...+ 5, (К) У(®) = #(®), (1.20) 
где 2(К) и (А) — заданные функции Е, у(А) — искомая функция. 


Ряд теорем, аналогичных теоремам для дифференциальных уравнений, уста- 
навливают свойства частных и общих решений линейных разностных урав- 
нений. Ограничимся лишь формулировкой этих теорем. 


Теорема 1. Если у (К), у2(К), Ур (К) — частные решения линейного одно- 
родного уравнения 
у(к +5) + 6 (К) У +5 1) +5 (®у(к+5-2)+...+ 5, (К) У(®) = 0, (П1.21) 
то и функция 
х(К) = спу (К) + соу (К) +...+ су (К), 


где су, Сә, ..., с, — произвольные постоянные, также будет частным реше- 


р 
нием этого уравнения. 


Теорема 2. Если 5 частных решений однородного уравнения (5), у>(К), 


у, (©) линейно независимы, то 


(К) = Усу (К) (П1.22) 
=] 


является общим решением однородного уравнения. 


Теорема 3. Общее решение линейного неоднородного уравнения (П1.20) 
представляется в виде суммы частного его решения у. (К) и общего ре- 


шения линейного однородного уравнения (11.22): 
У(К) = Участн (К) + (К) + Со у (Е) +...+срур(Ю. 


В дальнейшем ограничимся лишь уравнениями с постоянными коэффициен- 
тами, когда в (11.20) 5, (К) = сопѕї = 2, : 


УЕ +) +6 У +5-0+ЬУ(К+5-2)+...+ 5, У(®) = #(®). (01.23) 


Приложение 1. Конечные разности, суммы, разностные уравнения 221 


Рассмотрим однородное уравнение 
и(Е +5) + Би( +5 -П-+Ьи(+5-2)+...+Би(К) = 0. (П1.24) 


Частные решения будем искать в виде и(К) = Сү“ ‚ где С = сопѕї. Такой вид 


искомого решения подсказывает решение уравнения первого порядка с по- 
стоянным коэффициентом и(п) = Р"иу. Здесь уместно напомнить, что в диф- 


ференциальном уравнении 5-ого порядка с постоянными коэффициентами 
20900) + арг 00) +... +а,2(0) = 0 


частные решения ищутся в форме 2(1) = ехр(А,г). Подставим и(д) = Сү“ в 
уравнение (111.24) и после сокращения на ү“ (мы изучаем лишь нетривиаль- 
ные решения, и поэтому 7 = 0) получаем характеристическое уравнение 

ү + Бү? +..+Ь, =0. (П1.25) 


Это уравнение имеет 5 корней (с учетом их кратности): ү, ү, ..., Ү,. В за- 


висимости от алгебраической природы корней характеристического уравне- 
ния (вещественные, комплексные, кратные) разными будут и частные реше- 
ния, соответствующие каждому корню ү,. 


1. Каждому простому вещественному корню ү, соответствует частное ре- 
шение и, (А) = сүх ‚ являющееся одним из слагаемых в общем решении. 


2. Каждой простой паре комплексно-сопряженных корней ү, „у = (о, +, ) 


соответствуют комплексные частные решения, являющиеся линейно неза- 
ВИСИМЫМИ: 


и, (К) = (а, +18, у. и,1 (К) = (а, – ір, ). 


или вещественные частные решения 


и, (К) = р“ со5(Аф,), ш,.1(А) = р» т(ф,), р, = о + В: А о (0,) = ка 


р 


В общем решении им сопоставляются два слагаемых (вещественный ва- 
риант): 


с.р“ соѕ(АФф,) + е, р“ зіп(&ф,). 
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3. Если среди корней встречаются кратные, то корню ү, кратности р соот- 


ветствуют частные решения: 


и, (К) = үх, и, (К) = Күк, А ЕЕК | 


Решения эти линейно независимы, и в общем решении им сопоставляются 
слагаемые 


|: р: 1, К 
Со, Зоны О (Ку, 
где О (К) — полином от К степени р-1. 


Общее решение однородного уравнения в соответствии с теоремой 2 являет- 
ся линейной комбинацией частных решений, и, (К): 


и(К)= У. с,и, (К). 
=] 


Обратимся к неоднородному уравнению (П1.23). Если его правая часть 2(К) 
представляет собой линейную комбинацию полиномов от А, показательных 


функций, синусов или косинусов, то частное решение, как и в случае диффе- 
ренциального уравнения, можно подобрать в такой же форме. Универсаль- 
ным подходом по-прежнему остается метод вариации произвольных посто- 
янных Лагранжа. Суть его состоит в поиске решения в таком же виде, как и 


решение однородного уравнения, но при условии, что с, являются функция- 


ми независимой переменной с, = с, (К). 


5 
УК) = 2. с, (Ки, (К), 
=] 
где и, (к) — частные решения однородного уравнения, а с, (к) — искомые 


функции. Для нахождения этих функций надо сформулировать 5 условий. 
Само уравнение дает лишь одно условие, остальные 5—1 условия могут быть 
выбраны произвольно. Будем требовать, чтобы решение у(& + /) и в произ- 
вольной точке К +/ было по структуре такое же, как и в точке К (линейная 
комбинация частных решений): 


5 
У(к-+1)= У с, (Ку, (+1). 
=] 
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Итак, вычисляем решение в точке А +1: 
У +1) = с (6+1) у (+1) + о (+1 у>(К+10+...+с,+Пу, (+1) - 
(Ку (к +1) - со (К) (+1) –...– с, Ку, ++ 
+ с (К) у (К+ 1) + со (К) у (+1) +...+с, (А)у, (+1) = 
= Асу(А)у (А +1) + Ас, (К) у (+1) +... + Ас, (К) у, (+1) + 
+с (Ку (К+ 10) + со (К) у (К +1)+...+ с, (К)у, (+1). 
Для выполнения требования о совпадении структур решений надо положить 


(1) АЛа(е)у (+10) + Ле, (К)у (К +1) +... + Ас, (Ю)у, (+10) =0. 


Это и есть первое условие, наложенное на у(/), и тогда 


Уу(Е +1) = с (к) у (Е +1 + с (А) у (+1 +... +с, (КУ. (+. 
Вычисляем решение в точке & + 2: 
у(К+ 2) = с(к +1) у (+2) + с (6+1) у,(6+ 2) +... +с, (К+ 1)у, (6+2) – 
—– су() у (6+ 2) – с, (К)у (6+2) –...– с, (А)у, (К+ 2) + 
+ с (К) у (6+2) + (к) у (+2) +... + с, (К)у, (6+2) = 
= Ас (К)у (К+ 2) + Де (К) у (А+ 2) +... + Ас, (А)у, (6+2) + 
+ с(К)у (Е + 2) + с, (К) у (6+2) +... + с, (А)у, (К+ 2). 


Снова выполняем требование об одинаковости структур и получаем второе 
условие 


(2) Ас()у (+ 2) + Ас, (Ку (К+ 2) +... + Ас, (А)у, (+2) =0, 


Продолжая вычисление решений в точках & +3, & +4 ит. д. до +5 – 1, ана- 
логичным образом получаем остальные условия: 


(3) Ас (К) у (К +3) + Ас, (А) у (6+3) +... + Ас, (К) у, (6+3) = 0, 


(5 – | ) Ас, (К) у (А +5 1) + Ас. (К) у5 (К вы —1)+...+ Ас, (Ку, (А +5 – 1) =) 
И, наконец, последнее условие получаем из самого уравнения. 
Вычислим решение в точке Ё + 5 : 


УС + 5) = Ас (К) у (+ 5) + Де, (К) у (К+ 5) +... + Ас, (А)у, (К+) + 
+ с (Ку (К+) + со (К) у (+5) +... +с, (К)у, (К +5) 
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и подставим его и решения во всех предыдущих точках в уравнение (11.23): 
Ас (К) у (+5) + Де (А)у (К+ 5) +... + Де, (Ку, (+5) + 
+ с (Ку (А+ 5) + с, (А)у (К +5) +... +, (К)у, (К+) + 
+ Аус (к) у (+5 1) + рус (К) у (6+5 1) +... + рс, (Ку, (+51) + 
+ Рс (К) у (+5 2) + Б,с,(к)у (+5 2) +... + Б.с, (Ку, (+52) + 


+ Ба (Ку) + Вс (К) (0) +... + Б,с,(Ю)у, (К) = 8(®). 
Если в каждом ғ-ом столбце (без учета первой строки) вынести за скобку 
с. (А), то в скобках остается левая часть однородного уравнения 


у, (К+) + 6у, (К+ 1) + Бу, (+5 2) +... +6, у, (К), 


в которое подставлено его частное решение, т. е. все скобки обращаются В 
ноль, и остается лишь 


(=) Ас (к)у (+5) + Ае, (К) у (К +5) +... +Ас,()у, (+ 5) = (К), 
что является 5-м условием. 
Все 5 условий в совокупности 


Асу(К)у (К +1) + До, (А)у, (К +1) +... + Ас, (А)у, (+1) = 0 
Ас! (К) у (6+2) + Ао, (К) у (6+ 2) +... + Ас, (А)у, (К+ 2) = 0 


Ас (К) у (+5) + Де (К) у (+5) +... + Ас, (Ку, (Е + 5) = 2(К) 


образуют линейную алгебраическую систему относительно искомых функ- 
ций Ас, (А). Определитель этой системы отличен от нуля, т. к. образован из 


линейно независимых частных решений однородного уравнения, и, значит, 
система имеет единственное решение. Решение этой системы можно пред- 
ставить в виде: 


Ас, (к) = В, (Е) (Ю), 


где А, (к) — некоторая функция, вычисленная при решении линейной сис- 


темы, а 2(К) — правая часть исходного уравнения. 
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Е о. 
Просуммируем последнее равенство: 

к-1 

с, (к) = У, Р, (0800) + с, (0) 

і=0 

и построим общее решение неоднородного разностного уравнения: 
п [ К-1 
Уо.н. (К) = х. У, К, (02(1) зд С, (0) „(К). 


г=1\ 1=0 


Величины с,(0) являются произвольными постоянными. Используя началь- 


ные условия, можно найти их и получить частное решение. 


В заключение отметим, что более полно с материалом данного раздела мож- 
но ознакомиться в книге [23]. 


ПРИЛОЖЕНИЕ 2 


Линейные (векторные) 
пространства 


Идея линейности является одним из важнейших принципов математики. На 
этой основе построены классический анализ и вариационное исчисление. Более 
того, многие физические процессы в малом (в определенном смысле) являются 
линейными, что позволяет делать о них достаточно точные выводы, изучая ли- 
нейный, гораздо более простой для исследования процесс или объект. 


Определение. Линейным пространством называется множество В элемен- 
тов произвольной природы, именуемых векторами, удовлетворяющее сле- 
дующим аксиомам. 


1. Каждой паре х и у векторов из К ставится в соответствие вектор х + у, 
называемый суммой х и у, причем: 


• х+у=у+х (коммутативность сложения); 
е х+(у +2) = (х+у) += (ассоциативность сложения); 


• в К существует однозначно определенный вектор 0 (называемый 
нулевым) такой, что х +0 = х для каждого х из В; 


• каждому вектору хє К отвечает однозначно определенный вектор 
—х (называемый противоположным) такой, что х + (х) = 0. 


2. Каждой паре а и х, где а — скаляр из некоторого поля К, х — вектор 
из К, ставится в соответствие вектор ох , называемый произведением © и 
х, причем: 


• а(Вх) = (оВ)х (ассоциативность умножения вектора на скаляры); 


ө |х=х для каждого х. 
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3. Справедливо: 


е о (х + у) =ах + ау (дистрибутивность умножения на скаляры относи- 


тельно сложения векторов); 


• (о +В)х=ох+ Вх (дистрибутивность умножения на векторы относи- 


тельно сложения векторов). 


Эти аксиомы не претендуют на логическую независимость, но являются 
удобной характеристикой объектов, с которыми часто приходится иметь 
дело. 


Введенные операции называют внутренней (сложение векторов) и внешнеи 
(умножение вектора на скаляр). Что представляет собой поле К, из которого 
берутся скаляры для образования линейного пространства? Это наиболее из- 
вестная из алгебраических структур. 


Определение. олем скаляров К называется множество объектов, в котором 
введены две внутренние операции: сложение (аддитивная операция) и умно- 
жение (мультипликативная операция), удовлетворяющие аксиомам, которые 
перечислены в табл. П2.1. 


Таблица П2.1. Аксиомы сложения и умножения 


Сложение Умножение 


Коммутативность 


1. а+В= В+а 


1. аВ = Ва 


Ассоциативность 
2. “+ (В+) = (9+ В)+у 2. («В)у=а (Ву) 


Существование нейтрального элемента 


3. а+0=а 3. 2-1 = а 


Существование противоположного (обратного) элемента 


4. а+(-а)= 0 4. а-а! =] 


Дистрибутивность умножения относительно сложения 


5. а(В+у) =оВ+оү 
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Про векторные пространства говорят, что они образуются над некоторым 
полем по природе элементов этого поля: векторное пространство над полем 
рациональных (вещественных, комплексных) чисел или векторное простран- 
ство над комплексным (рациональным, вещественным) полем. 


Разнообразные линейные пространства получаются, если конкретизировать 
природу образующих пространство объектов и операций с ними. Приведем 
примеры некоторых линейных пространств, с которыми в той или иной мере 
приходится сталкиваться. 


1. Простейшим примером служат направленные отрезки на прямой, на плос- 
кости и в обычном пространстве. В физике с помощью таких отрезков, 
называемых векторами, изображают силы, скорости, ускорения ит. д. 


• На прямой сумма — это векторы, расположенные друг за другом, а 
произведение вектора на скаляр — это вектор, измененной в іо раз 


длины и с тем же (при о> 0) или противоположным (при а <0) на- 
правлением. Все аксиомы очевидно выполняются. 


• На плоскости сумма двух векторов — это вектор, представляющий со- 
бой диагональ параллелограмма, построенного на векторах-слагаемых. 
Относительно умножения вектора на скаляр можно повторить то же 
самое, что сказано в предыдущем пункте. 


• В обыкновенном физическом пространстве сумма — диагональ парал- 
лелепипеда, а произведение на скаляр, как в предыдущих двух пунктах. 


2. Введение декартовой системы координат позволяет устанавливать взаим- 
но однозначное соответствие между физическими векторами, как направ- 
ленными отрезками, и упорядоченными наборами скаляров, состоящими 
их одного, двух и трех скаляров (для векторов на прямой, плоскости и в 
обыкновенном пространстве соответственно). Нетрудно сделать следую- 
щий шаг и любую упорядоченную последовательность скаляров 
х = (х1,х),х3,...,х,) представить вектором, определив внутреннюю и 


внешнюю операции следующим образом: 
х+у= (х + у, + у, + у.х, + у), 0х = (951,02 ,0х,.... ах, ). 
Выполнение аксиом линейного пространства легко проверяется. 


Следует отметить, что именно этот пример является основным в теории 
линейных пространств. Линейные пространства такого типа часто назы- 
вают арифметическими линейными пространствами. 
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3. Линейное пространство образуют алгебраические полиномы степеней, не 
превосходящих натурального числа п: 


р(ї) = а] + а + азі? +..+а ці", ЛӨ) =} ++ Ы +...+ 6,12. 


Операции с полиномами ничем не отличаются от известных из школьной 
алгебры: 


р) +90) = (а +6) + (а +5, )1+ (а +) +... +(а, +,,)г", 
ор(і) = ад + аа, + аі +...+оа, і". 


Заметим, что полиномы конкретной степени и линейного пространства не 
образуют, потому что если а, | = –Ё,,у, то полином, являющийся их сум- 
мой множеству полиномов степени и не принадлежит. 


4. Линейное пространство образуют и непрерывные вещественные функции, 
заданные на промежутке [а, Ь]. Если внутренней и внешней операциями 


считать обычные операции сложения функций и умножения их на число, 
то нетрудно убедиться, что это так и есть. Изучение элементов такого про- 
странства является основной задачей математического анализа. 


Завершая рассмотрение примеров конкретных линейных пространств, оста- 
новимся на вопросе о том, какую роль могут сыграть скаляры из поля К при 
формировании линейного пространства. И внутренняя, и внешняя операции 
порождают новые элементы, причем внутренняя операция никогда не поро- 
ждает новые элементы другой природы, чем исходные. Так, например, скла- 
дывая два вещественных вектора, мы всегда получим вещественный вектор. 
С внешней операцией дело обстоит иначе. Если в качестве элементов линей- 
ного пространства выбраны вещественные векторы, полиномы или функции, 
то скаляры поля К могут быть лишь целыми, рациональными или вещест- 
венными. Если скаляры принадлежат комплексному полю, то мультиплика- 
тивная внешняя операция породит новый элемент, не принадлежащий исход- 
ному множеству вещественных векторов. Все сказанное относится ко всем 
рассмотренным примерам. Например, множество рациональных векторов над 
полем вещественных или комплексных скаляров линейного пространства не 
образуют. 


Приведенные примеры не исчерпывают всего многообразия конкретных ли- 
нейных пространств. Следующим шагом будет установление между элемен- 
тами пространства отношений, которые играют исключительно важную роль 
при рассмотрении линейных пространств. 
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Начнем с того, что образуем так называемую линейную комбинацию векторов 
ох + Ву +72 +...+ бу, (П2.1) 


где ©, В, у, ..., 9 — скаляры из поля К, ах, у, 2, ..., У — векторы линей- 


ного пространства В. 


Определение. Векторы х, у, 2, ..., У называются линейно зависимыми, если 
существуют такие скаляры а, В, 7, ..., Ө, из которых хотя бы один отличен 


от нуля, что линейная комбинация (П2.1) равна 0. 


ох + Ву + ү +...+ Өу = 0. 


В противном случае векторы х, у, 2, ..., У называются линейно независи- 
мыми. Другими словами, векторы х, у, 2, ..., У называются линейно неза- 
висимыми, если линейная комбинация (П2.1) равна нулю лишь при 


а= В=у=ш=0=0. 


Пусть векторы линейно зависимы, и, например, коэффициент о отличен от 
нуля. Тогда 


Ө 
ах = —Ву – үх... Өу или ТОБЕ тее а 
а а 01 
Таким образом, вектор х оказался выраженным через векторы у, 2, ..., У. 


При этом говорят, что вектор х является линейной комбинацией векторов у, 


2, .... У ИЛИ ЧТО вектор х разложен по векторам у, 2, ..., У. 


С понятием линейной зависимости/независимости векторов непосредственно 
связано понятие размерности линейного пространства. Обсудим это сначала 
на простых и известных примерах. 


На прямой любой вектор может быть выражен через другой вектор (рис. П2.1), 
т. е. два любых вектора пропорциональны или линейно зависимы. 


у=ах или 1у-ох = д0). 


Такое пространство целесообразно называть одномерным или размерности 1. 


Хх у 


Рис. П2.1. Вектор у можно выразить через вектор х 
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На плоскости всегда найдутся два линейно независимых вектора, а три лю- 
бых будут линейно зависимы. Это двумерное пространство. В трехмерном 
физическом пространстве линейно независимых векторов максимум три, а 
всякие четыре линейно зависимы ит. д. 


Таким образом, на прямой, на плоскости и в физическом пространстве мак- 
симальное число линейно независимых векторов совпадает с тем, что в гео- 
метрии называется числом измерений соответствующего пространства. 


А теперь сформулируем несколько определений. 


Определение конечномерности. Линейное пространство называется конеч- 
номерным, если в нем существует такая конечная система векторов, что лю- 
бой вектор пространства является линейной комбинацией векторов этой сис- 
темы. 


Определение размерности. Линейное пространство имеет размерность п 
(называется и-мерным), если в нем существует м линейно независимых век- 
торов и нет большего числа линейно независимых векторов. 


Определение базиса. Совокупность и линейно независимых векторов е}, 


е, ез, ..., е, п-мерного пространства называется базисом. 


Определение координат. Если векторы еј, е>, е;, ..., е, есть базис в и- 


и 
мерном пространстве и 


х= Се + Се) + Сзез +... + Сие, 
то числа бу, б›, бз, .... б, называются координатами вектора х в базисе 
ИНЕ / 


Теперь свяжем введенные определения с некоторыми из ранее рассмотрен- 
ных пространств. 


1. Приложение абстрактных математических понятий к таким физическим 
пространствам, как прямая, плоскость или реальный физический мир, ни- 
каких проблем не вызывает. Прямая, очевидно, является одномерным про- 
странством, а плоскость — двумерным. Из базисов на плоскости наиболее 
привычен прямоугольный или декартов, хотя и являющийся лишь част- 
ным случаем. Аналогично обстоит дело и с трехмерным физическим про- 
странством. 


2. Линейное пространство упорядоченных последовательностей скаляров: 


х= (21, Х2, №, ..., х, ). 
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Возьмем и векторов этого пространства: 


еј = (1, 0, ..., 0), 
е, = (0, 1, ... 0), 
е, = (0, 0, ..., 1). 


Покажем, что эти векторы образуют базис пространства. 


Проверим линейную независимость этих векторов. Пусть 
Ме + Ае) +... +А,е, =0. (П2.2) 
Раскроем левую и правую части этого равенства: 
А, (1, 0, ..., 0) + А, (0, 1, ..., 0) +...+А,(0, 0, ..., 1) = (0, 0, ..., 0). 
Преобразуем левую часть, выполнив необходимые операции: 


(А, Ао, Аз, Аи) = (0, 0, 0, ..., 0). 


Отсюда следует: № = А, = А; =... = \„ = 0. А это значит, что исходное ра- 
венство (П2.2) возможно лишь при: Ау = А, = Аз =... = А, = 0, т. е. векторы 
еу, е, ез, ..., е, — линейно независимы. 


Возьмем произвольный вектор х = (ху, х›,2х3,...,х,„). Запишем очевидное 


равенство: 
(21,22,23,..,х,) = х (1,0,...,0) +, (0,1,...,0) +... +х, (0,0,...,1), 


которое означает не что иное, как разложение вектора х по базису {е} 
х= уер + хоё + хе; +...+х,е,, где х, х2, 23, ..., х, — координаты век- 
тора х. 


Мы доказали, что {е} образует базис. Размерность пространства равна п. 


3. Линейное пространство полиномов с вещественными коэффициентами 
степени не выше и: р) = а +аі+ аі +... +а, і". Базисом этого 


пространства является, например, такой набор полиномов: е} =1, е, = /, 


ез = РТ е. =". Убедимся, что они образуют базис. 


Проверим линейную независимость векторов базиса. Так как равенство 


№ 1+5 1+3 д2 +..+А, 71 = 0 означает равенство нулю всех значе- 
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ний полинома, то это возможно лишь при № = А, = А3 =... = А, = 0. 


И е. 2 п 
Возьмем произвольный полином р(/) = ау + аг + аз! +...+ а, . 


Ясно, что его можно переписать так: р(ѓ) = ауе + 2,е, + 23е; +... + а, е, |. 
То есть произвольный вектор пространства полиномов с вещественными 


коэффициентами степени не выше и разложен по базису {е}, и, значит, 


а, 8), ... а, — его координаты. Размерность пространства и +1. 


4. Линейное пространство вещественных непрерывных функций на проме- 
жутке [а, Ь]. Пусть № — произвольное целое число. Тогда функции 


л@)=, 0) =, (=, ДО) =, Ју) =: образуют сово- 
купность из № линейно независимых векторов. (Это доказано в преды- 
дущем примере.) Однако, т. к. № — произвольное число, в пространстве 
может быть произвольное число линейно независимых векторов, т. е. про- 
странство бесконечномерное. Это означает, что при рассмотрении линей- 


ного пространства непрерывных на [а, | вещественных функций, надо 


иметь в виду, что в нем справедливы лишь те факты конечномерных про- 
странств, доказательство которых не зависит от размерности. К таким 
фактам относятся аксиомы скалярного произведения и неравенство Ко- 
ши — Буняковского, понятие ортогональности (об этом речь будет идти 
позже) и некоторые другие. 


Продолжим знакомство с линейными пространствами и рассмотрим переход 
от одного базиса к другому. Рассмотрим два базиса: "старый" 


ш) = (щу, и), ..., и,) и "новый" {У} = (ур, Уә, ..., У,). Произвольный вектор 


х в базисе {и} выглядит следующим образом: 

ХЕХ, + Хо) + Хм; +...+Х,0,, 
а в базисе {и}: 

Х= ХЈУ + ХУ) + 23У: +... ХУ). 


Здесь х, х, 23, ..., х, — координаты вектора х в базисе {и}, а ху, 25, 
х3, .., х, — координаты того же вектора в базисе {у}. Нужно установить 


связь между "новыми" и "старыми" координатами вектора х. 
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Для этого запишем разложение векторов "нового" базиса у, У), ..., у, ПО 
"старому" базису: 

У, = ащ +010 +...+ ади,, 

У) = 45щ + 20) +...+ аи), 

у, = 0,3 + ам) +...+ ам. 
Здесь числа а, — координаты векторов {у} в базисе {и}. Подставим эти 


разложения в выражение для х: 
х=х (ащ +410) +...+ ани, ) +2 (дәш +4500) +...+ аиом, )+...+ 
+х, (ал + 42,12 +...+ алии ) = 
= (ау + 2 +... + ах, )щ + (00 +4000 +... +а,Х,)и +...+ 
(ах + ах. +...+ али, ча. 
Получилось другое разложение вектора х по тем же самым базисным векто- 


рам, т. е. в последнем выражении в скобках стоят "старые" координаты, вы- 
раженные через "новые". Иными словами: 


Хх = а 1% + 2 На Чи» 
х = @1х| Е 425 Х> +... + „Хи, 
Хи = 1-м + ар2Х а к Ч тихи. 
Всю совокупность координат а; удобно записывать в виде квадратной таблицы н 


а| | ау? вое ово 41 


т 
а: 1 а) 7 н а) т 
а] ар? о н ат 


Такая таблица называется матрицей. Выполненные операции можно было 
проделать и в другом порядке, разлагая векторы "старого" базиса по векторам 
"нового". Получатся аналогичные формулы, но матрица будет другая. Обе мат- 
рицы оказываются связанными, и вторая называется обратной по отношению к 
первой. Следует также заметить, что множество матриц со стандартными опе- 
рациями сложения и умножения на скаляр образуют линейное пространство. 
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Все сведения, о которых шла речь до сих пор, определяют аффинные свойст- 
ва линейных пространств (аффинный — от лат. аи — родственный), ко- 
торые определяются лишь заданными операциями с элементами. Аффинные 
преобразования пространства — это такие, при которых сохраняются коор- 
динаты всех точек при переходе от одного базиса к другому и с помощью 
которых определяется, что такое прямая, плоскость, параллельные прямые, 
размерность ит. д. 


Мы рассмотрели лишь качественные понятия, игнорируя количественные 
характеристики, присущие физическим векторам, такие как длина вектора и 
угол между векторами. Эти характеристики связаны с измерениями, и поэто- 
му наделение пространства ими делает его метрическим. 


Внесение в линейное пространство "метрики" или его "метризация", т. е. вве- 
дение в нем упомянутых характеристик, можно осуществить различными 
способами. Мы сделаем это аксиоматическим определением скалярного про- 
изведения векторов. 

Определение. Если каждой паре векторов х и у линейного пространства К 
поставлен в соответствие скаляр из поля К, обозначаемый (х, у), то будем го- 


ворить, что в линейном пространстве введено скалярное произведение, причем 
скалярное произведение удовлетворяет аксиомам, представленным в табл. П2.2. 


Таблица П2.2. Аксиомы, которым удовлетворяет скалярное произведение векторов 


Вещественное пространство Комплексное пространство 


Симметричность 
1. (у) = (у,х) 1. (х,у) 


Выносимость скалярного множителя 


(у, х) 


2. (ах,у) = о(х,у) 


Дистрибутивность 
3. (х+у,2) = (х,2)+(у, 2) 3. (х+у,2)=(х,2)+(у,2) 


Положительность 


4. (х,х)>0, (х,х)=0 


(лишь при х=0) 


4. (х,х)>0, (х,х)= 0 


(лишь при х=0) 
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Символ означает комплексную сопряженность, обладающую следую- 


щими свойствами: х+у=х+у, ху =х:у, х=х. 


Линейное вещественное пространство с введенным в нем скалярным произ- 
ведением называется евклидовым пространством, а внесенная метрика — 
евклидовой. Линейное комплексное пространство с введенным в нем скаляр- 
ным произведением называется унитарным пространством, а внесенная мет- 
рика — эрмитовой. 


Со скалярным произведением связано знаменитое неравенство Коши — Бу- 
няковского — Шварца. Его формулировку определяет следующая теорема. 


Теорема. Для любых двух векторов со скалярным произведением справедли- 
во неравенство 


(х,у) <(х,х)-(у,у). 


Доказательство неравенства проведем лишь для вещественного пространст- 
ва. Цепочка равенств демонстрирует последовательное применение аксиом 
скалярного произведения: 


(ох – Ву,ох – Ву) = (ох Ву, их) + (ох – Ву, -Ву)= 
= о? (х,х) – 20В(х,у)+ В? (у,у)20. 


Выберем © = (х,у), В=(х,х). Тогда: 


(х,у)? (хох) -2(х,у) (хх) + (хх) (у,у)20 = (ху) <(х,х)(у,у). 


что и требовалось доказать. 


Рекомендуется самостоятельно выполнить доказательство для комплексного 
пространства и доказать, что равенство достигается, если хи у линейно зави- 
симы. 


Рассмотрим теперь, как выглядит скалярное произведение в конкретных ли- 
нейных пространствах, рассмотренных ранее. 


1. Проще всего дело обстоит с обычным физическим пространством. Там 
скалярное произведение вводится как произведение длин векторов на ко- 
синус угла между ними, т. е., например, на плоскости: 


(ху) = |х|-|у1соѕ0, 


где 9 — угол между векторами х и у. 
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2. Линейное пространство упорядоченных последовательностей веществен- 
ных чисел становится евклидовым, если скалярное произведение опреде- 
ляется следующим образом: 


(х,у) = хуу +... ХУ - ки 


Для унитарного пространства ситуация несколько иная: 
п 

(х,у) = ху + ху) +.. +Х х.У = Ў худ. 
к=] 


Заметим, что рассмотренный способ введения скалярного произведения не 
является единственным. 


3. В пространстве полиномов, заданных на [а, Ь], степени не выше ии с 


вещественными коэффициентами скалярное произведение вводится сле- 
дующим образом: 


А 
(р(1),(1)) = |р(да()а. 


4. В пространстве непрерывных функций, заданных на [а, $], скалярное 


произведение вводится аналогично тому, как это делается для полиномов: 


Б 
(70), 8а))= |0000. 


Внося метрику линейного пространства посредством введения скалярного 
произведения, мы оставили в стороне связь таких физических величин, как 
длина и расстояние, с самим скалярным произведением. Нагляднее и легче 
это сделать на примере двумерного пространства, т. к. здесь теорема Пифа- 
гора и тригонометрические формулы решают все проблемы. При этом ли- 
нейные пространства упорядоченных последовательностей скаляров являют- 
ся естественным абстрагированием и обобщением физического пространства. 


Запишем формулы метрических соотношений: 


х= х2 +2, |у|= у чу, |х-у|= (х-л) (о ә); 


й ее 


Ху 05у 


бет: + х5 ғ + у5 те 5 ты У! + у? ОУ УІ 
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Составными частями выписанных формул являются скалярные произведения: 


ху +2055 = (х,у)}; мм + әх =(х,х); УИ + уә = (у,у); 


(х-л) +(%-ж) =(х-у»х-у). 


В таких обозначениях формулы приобретают вид: 


+= Дж), = оу), Кэ) ар) та 


Приведенная иллюстрация (рис. П2.2) не может служить доказательством 
справедливости формул и для и-мерного линейного пространства. С этим 
можно ознакомиться в многочисленной элементарной и специальной литера- 
туре по линейным пространствам. 


в аа) еа ИЕ Пере Я ое О ее м О Туе ое лено 
еее ое АИО ИИ код ое вое о коне бес вне кожен" 
оное ооо За оон оно сео оо вереск оо она ме ово воно" 
Е) Е ПЕРИ ЕЕГ ЕАР СРБЕ. 
. а . • 
вене ме ИИИНИН ОООО вооон ни чо в.в ео бесов 


еее оо в боб оу ное ово чье ово обьем боевое 


. 
кое Фо ом ооо цене бок чаи в вузе" 


о ә 


ЕОС ЮЮеө0өюөэөөөэ500000500( 


и вв оо чене кеен о ев екон во" 


Рис. П2.2. Соотношения между векторами хиу 


Посредством скалярного произведения вводится еще одно важное понятие — 
ортогональность векторов. 


Определение. Векторы, скалярное произведение которых равно нулю, назы- 
ваются ортогональными: 


(х,у)=0. 
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Из формулы для косинуса угла между векторами видно, что понятие ортого- 
нальности обобщает понятие перпендикулярности: 


(њу) _ 
Мох Му) 


Важной процедурой является ортогонализация заданной системы линейно 
независимых векторов линейного пространства. Проведение такой операции 
называют процессом Грама — Шмидта, который состоит в последовательном 
построении системы ортогональных векторов у, У., ..., у, по системе ли- 


с0$ (@— В) = 


нейно независимых цу, Ц, ..., и,. 


Процесс ортогонализации можно было бы сформулировать в виде теоремы и 
строго доказать ее, пользуясь методом математической индукции. Оставим 
это на самостоятельную работу и ограничимся лишь описанием процесса ор- 
тогонализации. 


В качестве первого вектора ортогональной системы у; выберем ц. Второй 
вектор У, будем строить в виде у, = и, – о0,у и таким, чтобы он был орто- 


гонален уу, т. е. (у, у) = 0. Умножим у, скалярно на У, : 
(У,у) =0=(0›,у) 0, (у, у). 


(и, У) 
(У,у) 


Далее предположим, что ортогональные отличные от нуля векторы ү}, 


Отсюда 0, = . Таким образом, вектор у, построен. 


У), .... Ур] Построены. Вектор у, ищем в виде: 
Ук = Чу — Оу ОУ... О рУ. 
Выполнив условия ортогональности вектора у, векторам У|, У», ..., Ух, 
получим: 
(Ур у) =0= (их, У, )- Яр (У,у) 04 (У,у)... = (урут), 
(У,у) =0 = (0, у) о (Ур, У2) — 942 (У2,У2)–... = (Ур), 


(У,у ) =0 = (ИУ ) — (р! (У ) — М А2 (У, У Е т О к] (ур У] ) : 
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Из этих равенств находим: 


(и, у) (ч,уз) (ик У) 
НА, ЕН рр ЕРСААААА 
й (У У) Е (У,у) ра (Уур) 


и вектор у, оказывается построенным. Продолжая процесс, получим всю 


совокупность ортогональных векторов Гу }. 


Завершим описание процесса доказательством, что вектор у, отличен от ну- 
5 


ля. Для этого нам понадобится линейная независимость векторов ш, и», 


и которая до сих пор нигде не использовалась. Вектор У; есть линейная 


п? 
комбинация векторов их, үү, У, ..., үџл, вектор у, — линейная комби- 
нация векторов и, у, үү, У», ..., Уфо ит. д. Подставим в выражение для У, 
линейные комбинации, определяющие векторы у, у, Уу_2, ..., у}. В резуль- 


тате получим: 
УЕ | "Их Аа +А 290,9 +...+Лщ, 


где №, А, ..., Ар — коэффициенты, получившиеся в результате приведе- 
ния подобных членов после подстановки. Совокупность векторов {и} линей- 
но независима, и, значит, линейная комбинация векторов {и} может обра- 


щаться в ноль лишь при нулевой комбинации коэффициентов. Однако при 
векторе и, стоит коэффициент, равный единице, т. е. вектор у, в ноль обра- 


титься не может. Получаем противоречие. 


Построенные векторы у}, У, .., У, определяют только направления орто- 


гональных векторов. Часто удобно иметь дело с векторами некоторой фикси- 
рованной длины, например, единичной. Приведение векторов к единичной 
длине, состоящее в вычислении длин векторов и делении компонентов на 
них, называется нормированием, а ортогональные векторы единичной дли- 
ны — ортонормироваиными. 


К сожалению, процесс ортогонализации численно неустойчив, и возникаю- 
щая во время его проведения погрешность часто приводит к значительному 
нарушению ортогональности строящейся системы векторов. Для борьбы с 
этим явлением используют доортогонализацию, которая развивает и про- 
должает саму ортогонализацию. 
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Например, "доворот" вектора у› до перпендикулярного по отношению к у, 
положения осуществляется итерационным процессом 


6.) 
(А) А 
Ло5ү = 


(Е) (0) 
Е Е (У,у) 


(к) 
— Лоу у, А 
О =у,, К=2, 3, 4 
где Уу = У), К=2, 5,4, ... 
Вычисления прекращаются, когда ортогональность обеспечивается с требуе- 
МОЙ точностью, и за окончательное значение У» принимается у). 


Аналогично процесс доортогонализации осуществляется и для следующих 
векторов из, ид, ... Например: 


(4-1) (А-1) 
у У у У 
К) _ (м Г) Г: р (“ м) К) (м з) 
у; = ү; ) — да; – Лоу, Ло) =, о а 
(У,у) (У,у) 


где У =У., К=2, 3,4, ... 


В подтверждение тезиса о численной неустойчивости процесса ортогонали- 
зации приведем численный пример. Все вычисления проводятся с пятью зна- 
ками точности. 


и; = (0.63257, 0.31256), и, =(0.56154, 0.27740). 
Нормируем векторы. и, |= 0.70558, [м >| = 0.62632, 


м 0.44298), и" =-2 = (0.89657, 0.44290). 
Ы 


Как видно, векторы почти параллельны, т. е. почти линейно зависимы. Про- 
ведем их ортогонализацию: 


= (0.00004, – 0.00008). 


Нормируем У): У = —— =(0.44721, – 0.89442). 


м1” 


Проверим ортогональность уү и уз : (у, у>) = 0.00427 + 0. Действительно, 
ортогональность нарушена и довольно существенно. Нетрудно заметить, что 
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перпендикулярными к У, являются векторы У! = (-0.44298, 0.89652) и 


2 =(0.44298, – 0.89652), отличающиеся лишь знаком, и ортогонализация 
явно не удалась. 


Проведем доортогонализацию. 


= (0.44721, – 0.89442) – (0.00472/0.99998)(0.89652, 0.44298) = 
= (0.44298, – 0.89651). 


Оказалось, что достаточно одной итерации. 


Проводить ортогонализацию векторов можно в любой последовательности. 
Вместе с тем, следует учитывать, что порядок выбора векторов может ока- 
зать существенное влияние на устойчивость процесса ортогонализации. Так, 
например, на очередном шаге в качестве вектора и, можно привлекать тот, 


который образует наименьшие скалярные произведения со всеми ортого- 
нальными векторами У, , построенными ранее. 


Вернемся к вопросу о связи скалярного произведения с метрическими вели- 
чинами — длинами, расстояниями и углами. Мы установили, что 


В 


При естественных обобщениях и переходе к формальным математическим 
конструкциям часто появляются понятия, обобщающие физические. Сделаем 
это в отношении длины вектора. В линейных пространствах говорят о норме 
вектора, что для физического пространства ничем не отличается от длины. 


|х| =/(х,х), соѕ(0– В) = 


Для нормы вводится и свое обозначение: |х|. Пусть пока |х| = (х,х) . До- 


кажем три теоремы, связанные с нормой. 


Теорема 1. | > 0, |х) = 0, если х= 0). 


Это непосредственно следует из положительности скалярного произведения. 


= 191-11: 
[ах] = 4 (ох,ох) = үо2 (х, х) = [хх = |6. 
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Теорема 3. |х + | < |х + |у| ‚. (Неравенство треугольника.) 
Доказательство этой теоремы основано на неравенстве Коши — Буняковско- 
2 
го (х,у) <(х,х):(у,у), которое может быть записано так: (х,у) < ||х|-[у|. 
|х| =(х+у,х+у) =(хх) +2(х,у) +(у,у) = || +2(х,у) |У = 
2 2 
< |х“ ++ = (11-11): 


|х + У |+ 


Теперь эти три теоремы можно трактовать как аксиомы, и с их помощью в 
линейном пространстве постулировать новое понятие — понятие нормы. Ак- 
сиоматическое определение подразумевает, что любые числа, удовлетво- 
ряющие аксиомам, являются нормой. Одно из множеств таких чисел опреде- 
ляется формулой: 


| 
р, г (х р Е о +... + Іх, |? Р 5 
где р — целый параметр. 


Тем самым в линейном пространстве метрические характеристики могут 
быть введены по-иному, чем это делалось ранее с помощью скалярного про- 
изведения. 


Остается лишь привести некоторые конкретные значения числа р, отвечаю- 
щие наиболее употребительным нормам. При р=2 имеем: 


УВ = Джх). 
Два других значения р, а именно | и о , порождают следующие нормы: 
п 
= М, = так 
1= 
Эти нормы имеют собственные имена: 


| октаэдрическая || = У » 


О сферическая х, = (хх) 


О кубическая |х]. = тах |х, |. 
{ 
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Названия произошли от геометрических фигур, которые образуются в ре- 
зультате заполнения некоторого объема всевозможными векторами одинако- 
ВОЙ ДЛИНЫ. 


В заключение определим, как выполняются операции дифференцирования и 
интегрирования с векторами, если их координаты зависят от некоторой неза- 
висимой переменной /. Тогда 


х(Е) = (100), х(0),...,х,(0)), 


20 [2 ё 5 
а а’ а 


і 1 1 і 

х(т)ат = | (х (тат, |х, (т)ат,..., |х (т)ат |, 
| | | | 2 | п 
0 0 0 0 


ЕО) 20 56+ 16 х(о), а0) 


а 


ПРИЛОЖЕНИЕ 3 


Элементы теории матриц 


ПЗ.1. Общие сведения о матрицах 


Матрицей называется совокупность их т скаляров а., образующих прямо- 


И? 
угольную таблицу из и строк и т столбцов: 


а ауэ Р аһ 
а, 955 о ‘Иа а) 
а а,2 И, ае аит 
Скаляры а; (1=1, 2, ..., и, ј =1, 2, ..., т) называются элементами или ком- 


понентами матрицы. Первый индекс всегда означает номер строки или чис- 
ло строк, а второй — номер столбца или число столбцов. 


Определение матрицы, как единого алгебраического объекта А, принадле- 
жит английскому математику Артуру Кели (Атїһиг Сауеу). Примером мате- 
матических рассуждений, где появляется такой алгебраический объект, мо- 
жет служить преобразование координат вектора при изменении базиса 
линейного пространства. 

Известные алгебраические объекты, такие как скаляры и векторы, можно 
считать частными случаями матриц: для скаляров и = т =1, для векторов- 
строк и =1, для векторов-столбцов т =1. Матрица 0 является нулевой, если 
все ее элементы представлены нулями. При т = п матрица становится квад- 
ратной. Элементы а, 4255, 933, ..., а,„ образуют главную диагональ, эле- 


менты а, 9) „1, 932, - ай — побочную. Сумма диагональных элемен- 
тов образует след матрицы: 
п 
Т(А) = У а,. 


1=1 
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Если все элементы матрицы, кроме тех, что на главной диагонали, равны ну- 
лю, матрица называется диагональной и обозначается 
Ш = діао(А) = іаре(а, а, ·.., а,и). Диагональная матрица с компонентами, 


равными единице, является единичной матрицей и обозначается буквами Е 
или І. Если все элементы матрицы выше главной диагонали равны нулю, то 
такая матрица называется левой треугольной или нижней треугольной. Ана- 
логично, если все элементы матрицы ниже главной диагонали равны нулю, 
то такая матрица называется правой треугольной или верхней треугольной. 


Если рассматривать матрицу как сложный объект, состоящий из скаляров, то 
она может быть подвергнута некоторым преобразованием, в частности, пере- 
становке местами строк и столбцов: 


Ч | а} ра аһ а} | 01 дв аве а] 
4 | а)? У а) н 12 952 п анһ? 
— 

Ч, | а,? м Чит Ч] т а па р ант 


Новая матрица называется транспонированной, а сама операция — транспо- 


нированием: А > А”. Ясно, что (А), = А. Важным классом матриц явля- 
ются симметрические, а именно те, что не меняются при транспонировании, 


т. е. когда А! =А. 


Скаляры, образующие матрицу, могут быть как из множества вещественных, 
так и из множества комплексных чисел. Как было уже видно, введение в об- 
ращение комплексных чисел влечет за собой определенные изменения в мет- 
рических характеристиках линейных пространств и их элементов, таких, как 
скалярное произведение, длина, норма, расстояние между элементами. 
В комплексном случае операция транспонирования совмещается с заменой 
комплексных чисел на комплексно-сопряженные, а сама операция называет- 


ж 
ся эрмитовым сопряжением и обозначается символами или Я: 
ж 
А» А‘ = А. 
В трехмерном варианте имеем: 
ар іу @а2-№2 аз +13 а1+: 41-1, азр № 
а + 1621 453 аз + Рз || ар +182 922 932 + 1632 


азу +31 @32-1№32 @33 №33 аз Вуз әз рә 33 – зз 


Приложение 3. Элементы теории матриц 247 


Очевидно, что (АЛ уе = А. Если случится, что А! = А, то матрица называ- 
ется эрмитовой или самосопряженной. 


а | а2 +2 аз +163 а | ә іру аз – зі 
а) + 1612 453 а2з + Фэз |2 | а) — р 452 3) — 1632 
аз + 31 @32 + 632 а33 аз 3 93 – № а33 


Из определения следует, что диагональные элементы эрмитовой матрицы 
вещественны. 


П3.2. Операции с матрицами 


Матрицы образуют линейное пространство и даже более богатую алгебраи- 
ческую структуру — кольцо. Это означает, что на множестве матриц, прежде 
всего, вводятся операции сложения элементов пространства (матриц) и ум- 
ножения элементов пространства (матриц) на скаляры. Таким образом, по- 
рождается линейное пространство. Обе операции определяются покомпо- 
нентно, т.е. при сложении складываются элементы с одинаковыми 
индексами (и это накладывает ограничение на операцию в том смысле, что 
могут складываться только матрицы с одинаковым числом строк и столбцов), 
а при умножении на скаляр умножаются все компоненты. 


Ч | а? а ^ еа Ч] т 6 9 ер Бун 
а) | 1005) а. Ч а) Б, Б, Но Б Б, „ 
А +В =| ... о а с м р а ео ое зн о — 
Ч 82 арт Б 0 дри 
ар + аә +6 ат + Ё 
а +65: 99) +622 ат + 62т 
== р 
ан + Б 4,2 + 6,2 ант + Ёт 
Са | Са] > Чт 
аа. | а4,, аа, 
ХА = 


аа 8, ... -. аа 
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Нейтральным элементом для аддитивной операции являются нулевая матри- 
ца, а единицей для умножения матрицы на скаляр — скалярная единица. Обе 
дистрибутивные операции выглядят как обычно в линейных пространствах: 


(о + В)А = оА + ВА, 
(А +В) = 0А +аВ. 


Введение мультипликативной операции с матрицами порождает структуру 
кольца. Естественным является вопрос: почему кольца, а не поля? Это стано- 
вится ясным после определения самой операции умножения матриц. Компо- 


ненты Су; матрицы произведения С р вычисляются как скалярные произве- 


дения строк левой матрицы А ,, на столбцы правой матрицы В. | 


т 


су = Хаб, 
К 


Легко убедиться, что введенная операция ассоциативна: 
(А.В).С=А.-(В.С). Но она не коммутативна. Именно поэтому и не получа- 


ется структура поля. Убедиться в некоммутативности можно, даже не выпол- 
няя никаких операций. Например, при умножении матрицы А, на матрицу 
В, получится матрица С.>, а при умножении В; · Ад = С... Более того, 


для матриц Ад и Вл; вторую матрицу на первую умножать вообще нельзя. 
Частным случаем является умножение матрицы на вектор. 

ар аә || | а + 225 

Әр 9922 22 Яр! + 52) 


Здесь и в дальнейшем будем употреблять термин "вектор" применительно к 
вектору-столбцу. 


Обратимся к аксиомам существования нейтрального и обратного элементов 
для операции умножения матриц. Прежде всего, заметим, что речь может 
идти лишь о квадратных матрицах. Роль нейтрального элемента естественно 
играет единичная матрица: А.Е=А. Проблема существования обратного 


_] < 

элемента в аксиоме А.А = Е решается следующим образом. Каждой квад- 
ратной матрице ставится в соответствие скаляр 4еКА), называемый опреде- 
лителем матрицы. Определитель есть сумма произведений элементов мат- 


рицы, таких, что в каждом произведении и сомножителей и каждая строка и 
каждый столбец представлены по одному разу. Знак каждого слагаемого оп- 
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ределяется совпадением (+) или несовпадением (—) четностей перестановок 
первого и второго индексов элементов. Если определитель оказывается рав- 
ным нулю, матрицу называют особенной или вырожденной, в противном 


случае — неособенной или невырожденной. Обратный элемент А сущест- 
вует лишь для неособенных матриц. Из множества свойств определителей 
потребуется следующее: 4еКА . В) = д4еКА). дек В). 


Нахождение обратной матрицы связано с довольно трудоемкими вычисле- 
ниями. Однако существуют матрицы, обратные для которых находятся отно- 
сительно легко. В частности, такими матрицами являются диагональные и 
треугольные. Особое место занимают матрицы, для которых обратная равна 


е 1 я 
транспонированной, т. е. О’ =О`', и с учетом равенства О 'О=Е имеем 


О7о = Е, Так как элементы матрицы произведения вычисляются как скаляр- 
ные произведения строк левой матрицы на столбцы правой, легко заметить, 
что единичная матрица как результат умножения может получиться тогда и 
только тогда, когда столбцы матрицы О ортонормированы. Такая матрица 
называется ортогональной и обозначается буквой ©. 


----@ ---- (1 | |) (то 
----@ ----| | | 11010 
99 = и аф 94,1510 01 
У. | 
МТ ЕРЕ 0. 1 17 10 оо | 


Ортонормированными оказываются и строки матрицы с учетом равенства 
Т Т 

О О=Е=00 . 

Приведем примеры ортогональных матриц, ограничившись матрицами 2х2. 


С Матрица вращений (поворачивает вектор на угол Ө без изменения длины 


вектора) 
б- с059 —5т0 от = 0-1" = с059 510 
ѕіпӨ соѕ0 /' —510 соѕ0 
С Матрица перестановки 
рео 1) верты 


1 0 о’ 
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Матрица Р отображает каждую точку (х, у) в ее зеркальный образ (х, у) 


относительно прямой у = х, проходящей под углом 45° к оси х. В трех- 
мерном случае матрица Р имеет вид: 


0 
1|, РГЕР- = 
0 


=> = о 
- о > 
СЭ. ©: а 


Наиболее важным свойством ортогональных матриц является то, что умноже- 
ние на ортогональную матрицу сохраняет длины и скалярные произведения: 


9х] = |х| (Ох,Оу)= (ху). 


В случае комплексных элементов матрица с ортонормированными столбцами 
называется унитарной и обозначается буквой 0, а основное соотношение 
имеет вид: 


0. 


Присутствие заметных различий между алгеброй скаляров и алгеброй матриц 
иллюстрирует и следующий факт. 


Алгебра матриц: нулевая матрица может быть разложена на ненулевые 
множители, т. е. 0 = АВ, причем А +0 и В +0. 


Алгебра скаляров: нуль не может быть разложен на ненулевые множители, 
т. е. если аһ = 0, то либо а= 0, либо Ъ = 0, либо а= = 0. 


Сформулируем несколько свойств обратной и самосопряженной матриц, до- 
казательство которых рекомендуется провести самостоятельно: 


О (А7 =А; 

О (АВу! = ВА!; 
О аеА! =1/дегА; 
С (АВ) -В'А; 
О (АТ!) = (А). 


Еще несколько задач связано со свойствами диагональных и треугольных 
матриц. 


О При умножении матрицы А на диагональную матрицу О слева В = РА 
все строки А умножаются на соответствующие диагональные элементы. 
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С При умножении матрицы А на диагональную матрицу О справа В = Ар 
все столбцы А умножаются на соответствующие диагональные элемен- 
ты. Как частный случай, имеем равенства А = ЕА = АЕ. 


О При умножении треугольных матриц одного вида (например, левых тре- 
угольных) получается матрица того же вида (т. е. левая треугольная). 


(3 Обратная матрица для левой треугольной является треугольной матрицей 
того вида. 


Введение операций с матрицами позволяет вместо условного обозначения 
для скалярного произведения в евклидовом и унитарном пространствах ис- 
пользовать формулы, отражающие арифметические операции. Приняв за ос- 
нову изображение вектора столбцом 


Т 
строку будем записывать х” = (ж,^>,...х„) . Тогда скалярное произведение 
в евклидовом пространстве будет вычисляться по формуле 


5 п =) п 
х/у= У хуу = (х,у), а в унитарном ху=у х= У хуу = (х,у), где компо- 
к=] к=] 


ненты вектора у сопряжены по отношению к вектору у, а у” — вектор, эр- 

митово сопряженный с вектором у. В этих обозначениях свойство сохране- 

ния скалярного произведения для ортогональной матрицы имеет вид: 

(Ох) (Оу) = х0 Оу = хгу. 

Весьма полезное свойство имеет место для скалярного произведения с мат- 
. 

рицей (Ах,у): (Ах,у)=у Ах (Ау) х= (х,А`у). Таким образом, матрицу 


можно перемещать из одного сомножителя скалярного произведения в дру- 
гой с выполнением операции сопряжения (в вещественном случае — транс- 
понирования). 


Среди всех самосопряженных матриц особо важную роль играют положи- 
тельно определенные матрицы. Самосопряженная матрица называется поло- 
жительно определенной, если (Ах, х) > 0 для всех ненулевых векторов х. 


Аналогично, с неравенством (Ву, у) < 0 связано определение отрицательно 


9 Зак. 3418 
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определенной матрицы. Используя положительно определенную матрицу, 
можно ввести скалярное произведение с матрицей (Ах, у), удовлетворяю- 


щее всем аксиомам обычного скалярного произведения: 
О (Ах, у) = (Ау, х); 

О (<Ах, у) =о(Ах, у); 

О (А(х+у), 2) =(Ах, 2) + (Ау, 2); 

О (Ах, х)>20; (Ах, х) = 0, если т=0. 


Завершим раздел несколькими терминологическими замечаниями. Совре- 
менное теоретико-множественное представление об отображении, которое 
каждому элементу одного множества ставит в соответствие элемент другого 
множества, вобрало в себя частные случаи отображаемых и отображающих 
множеств, а исторически некоторые отображения имеют свое название. Так, 
отображение элементов множества континуума (числовой оси) на числовую 
же ось издавна называлось функцией. Например: 


у=зш(х), у=а+ђе*, у= (х). 


Отображение элементов линейного пространства во множество элементов 
числовой оси называют функционалом. Вот примеры: 


п Ь 
=, |х, = тах, у= Јах. 

і =] а 
Самым общим отображением является оператор, когда элементы некоторого 
пространства отображаются на элементы этого же или другого пространства. 
Оператор обычно обозначают так: г = АЁ, Здесь Ї и в — элементы линей- 
ного или более общего, например, банахова или гильбертова пространства, а 
А — оператор. Оператором является матрица А в равенстве у = Ах (а само 


равенство представляет собой линейное преобразование), оператор представ- 
Ь 


лен интегралом в выражении #(х)= | К(х, у) (у)ау, ставящем в соответствие 


а 


каждой функции Г функцию 2. 


Таким образом, матрицы в функциональном смысле можно рассматривать 
как операторы. Такие операторы удовлетворяют условию линейности: 


А (^1х; + А.х, ) = А Ах! ТР ^2Ах., 


где Ар, А — скаляры, х, х, — векторы, А — оператор (матрица). Равен- 
ство это непосредственно основано на матричных операциях, введенных в 
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(П3.2). В алгебре матриц говорят, что матрица А есть матрица линейного 
преобразования. 


П3.3. Собственные значения 
и собственные векторы матриц 


Рассмотрим линейное преобразование с квадратной матрицей А,, : 
у= Аи. 


Поставим задачу: для заданной матрицы А найти такие векторы и, которые 
сохраняют свое направление после линейного преобразования. Другими сло- 
вами, каковы должны быть векторы и, чтобы вектор у был пропорционален 


или коллинеарен вектору и, т.е. у = Аи. Тогда 
Аи = Ли или (А -АЕ)о =0. (П3.1) 


Числа А и векторы а, удовлетворяющие этому уравнению, получили назва- 
ние "собственные значения" и "собственные векторы" соответственно. Ра- 
венство (П3.1) представляет собой однородную линейную алгебраическую 
систему относительно искомых компонентов вектора и. Известно, что если 
определитель матрицы А АЕ не равен нулю, то система имеет единствен- 
ное тривиальное нулевое решение и = 0. Чтобы система (ПЗ.1) имела нетри- 
виальные решения, нужно потребовать, чтобы ее определитель был равен 


нулю: аеѓ(А - ЛЕ) = 0. Запишем это равенство в покомпонентном виде: 


а | 012 006 .09 Чт А, 0 0 
Ч> | 022 92 0 А, 0 0 
де т -10 0 А 0 | (= 
Ч; | Ян е аа арт 0 0 0 А, 
а = А а? Чт 
221 422 = А Чт 
= беї КҚ = (). 


ау] ар? Т аут – А 
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Вычисление этого определителя дает: 
де (А -АЕ) = (1) +В" +... +, 1А +6, = 0. (П3.2) 


Полином, стоящий в левой части этого уравнения, называется характери- 
стическим полиномом, а само уравнение — характеристическим уравнени- 
ем. Оно имеет ровно и корней с учетом их кратности. Это. и есть собствен- 
ные значения матрицы А, А, ..., А,„. Они составляют спектр матрицы А , а 


величина р(А) = тах, (1=1,2,..,п) называется спектральным радиусом. 


Для каждого А; можно найти решение и, однородной системы Аи, = А;и,, 
т. е. собственный вектор. Если все собственные значения различны, то и, 
образуют систему из п различных векторов. 


Поскольку собственные векторы находятся из решения однородной системы, 
то и известными они оказываются с точностью до постоянного (ненулевого) 
множителя, т. е. собственные векторы однозначно определены по направле- 
нию, но их длины (нормы) остаются произвольными. Часто бывает удобно 
приводить векторы к единичной длине, т. е. нормировать их. 


Приведем пример вычисления собственных значений и собственных векто- 
ров матрицы 


_[-51 –49 
0—50 -50/ 
Собственные значения: 
—-51-А 49 
де (4 -АЕ) = е = А2 +101. +100 = 0, 
-50 —50-А 


№ = – 100, Л = = |5, 
Собственные векторы: 


—51 —49 И] | 100 и | —51 —49 и 2 И) | 
—50 —50 И] 2 #12 —50 —50 Ии5> Иә? 
—49и = —49и 1 —50и>1 — 49и, 
Шә = 11| а 059) 
| —49 
И, |1 ЕРЕ 
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Нормируем собственные векторы: 


2 
[м [= Ум = У2м [> [= (92,0; - (50. +1201 
49 


ЕЕ. и 2500 | — 
норм а норм _ 42 _ 4500 50 |. 
ЫР 2 Ыр Уо 


Остановимся на некоторых свойствах собственных значений и собственных 
векторов. 


Теорема 1. Собственные векторы, соответствующие различным собственным 
значениям, линейно независимы. 


Доказательство. Составим линейную комбинацию собственных векторов, 
соответствующих различным собственным значениям: 


СЦ + СЧ. +... +С, = 0. 

Умножим ее на матрицу (А – АЕ): 

С] (А вы АЕ) + 160) (А == АЕ )а, РЕ С (А ха МЕ) м; = 0. 
Первое слагаемое равно нулю по определению собственного вектора. Остав- 
шуюся часть умножим на матрицу (А – А.Е): 

С> (А = ^,Е)(А = АЕ)и; Рат Ск (А БЕ \,Е)(А = АЕ), = (). 

И в этой сумме первое слагаемое равно нулю, что легко видеть из нижесле- 
дующего: 

с (А -\Е)(А - АЕ), =, (А -^Е)(Ач – Аш) = 

= С) (А == ^,Е)(А,м, == А0, ) = С> (^2 а № )(А == ^,Е)о,. 
Продолжая описанную процедуру, придем к равенству: 

С (А = ^^ 1Е)(А — ^_2Е)-...(А == АЕ)и, = 0, 

которое возможно лишь при с; = 0. Теперь, просматривая в обратном поряд- 
ке все равенства, получавшиеся после умножения на очередную матрицу 
(А АЕ), видим, что су =0, су_› =0, .., с = 0, что и доказывает линей- 


ную независимость собственных векторов щу, и), ,..., цу. 
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Следствие. Если все собственные значения матрицы различны, то все собст- 
венные векторы — линейно независимы. 


Определение. Матрица А называется матрицей простой структуры, если 
все ее собственные векторы линейно независимы. 


Очевидно, что матрица с различными собственными значениями имеет про- 
стую структуру. Значительно сложнее обстоит дело с собственными векто- 
рами у матриц с кратными собственными значениями. Однако и такие мат- 
рицы могут иметь простую структуру. Примером может служить единичная 
матрица Е, имеющая и линейно независимых собственных векторов и од- 


но собственное число кратности и, равное 1. 


Теорема 2. Собственные значения самосопряженной матрицы вещественны. 

Доказательство. Рассмотрим два равенства: Аи = Аи и получившееся из 
* ж о ож 

первого после операции сопряжения и А = Аа . Умножим первое слева на 


* : 
и , авторое справа на и и вычтем второе из первого: 
ж ж ж ж — ж 
и Аи-и А и = Ла о - А и. 
ж а ж 
Выражение слева равно нулю, т. к. А = А. Тогда (А-А) и = 0. Скалярное 


| ТА 
произведение и и = 0), значит, А = \, что возможно лишь для вещественных 
чисел. 


Теорема 3. Собственные векторы самосопряженной матрицы, соответст- 
вующие различным собственным значениям, ортогональны. 


Доказательство. Возьмем два различных собственных значения А; и А; и 
соответствующие им собственные векторы и; и ц,. Равенство Аи, = Ли, 


скалярно умножим на и, , а равенство Аи, = Аш, на и’: 


(Аим, )=А, (мм, ); (Ащььи, ) = А, (ирьм, ). 
В первом равенстве переместим А во второй сомножитель с учетом, что 


А” = А ‚ и вычтем получившееся равенство из второго: 
В итоге имеем: 0 = (А, – А, (их, и; ). По условию А, – А, = 0. Следовательно, 


(и, и, ) = 0, что и означает ортогональность собственных векторов ц, и ц. 
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Представление о свойствах матрицы А будет более полным, если рассмот- 
реть собственные векторы транспонированной матрицы А’ или сопряжен- 


Е ж 
НОЙ А. Определитель матрицы не изменяет своего значения, если строки и 
столбцы меняются местами, поэтому характеристические полиномы и урав- 


нения для матриц А и А” совпадают, т. е. де (А -АЕ) = іе (А? -^Е)=0. 


Следовательно, и собственные значения обеих матриц будут одни и те же. 
(Для комплексных матриц собственные значения и коэффициенты характе- 


ж 
ристических полиномов матриц А и А комплексно сопряжены.) Однако 


Г 
собственные векторы у А и А, вообще говоря, будут различными. Таким 
образом, есть и собственных значений А, Аз, ..., А, и 2н собственных век- 


торов, а именно и собственных векторов матрицы А: щ, и,, ..., ц, и и 


Т 
собственных векторов матрицы А : ү|,У›,...,У,. 


Уравнение для собственных векторов матрицы А” 
Е 
А у; = А;у, 
можно преобразовать с помощью операции транспонирования в 
ПАЧЕ Т 
у, А = А;у; , 
и поэтому иногда векторы у; называют левыми собственными векторами 
матрицы А ,а и, — правыми. 


Между правыми и левыми собственными векторами матрицы А может быть 


Т 
установлена связь. Умножим равенство у, А = Ау, справа на и, а равен- 


ство Ац, = А;и, слева на у! и вычтем одно из другого 
= Г 
0= (А; Ак) уг и, 
ее 
т.е. у; ц, =0 при А; + А. 


Т ' 
Если векторы имеют вещественные элементы, то у; и, =! у; =(0,у;)=0 


для і + Е. Это значит, что каждый вектор из одного ряда ортогонален любо- 
му вектору из другого, за исключением вектора с тем же индексом. Такое 
свойство называется биортогональностью, а векторы биортогональными. 
Для векторов с комплексными компонентами (т. е. в унитарном пространст- 


ве) УГ и, не является скалярным произведением. 
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Г 
Скалярное произведение у„и, из-за неопределенности длин собственных 
векторов может принимать произвольное значение. Часто удобно считать, 


что уги, =1. Добиться этого можно нормированием скалярного произведе- 
ния по одному из векторов, например по аи, . Если уги, = с, то, заменив џи, 
на ц; = ц, / с » получим угу =1. 


Произвольный вектор х может быть разложен ПО собственным векторам 
матрицы ЧТ, и, .... Ц 


А 
Х = Вц, и Ви, е Б Вим, р 
Умножим вектор х справа на вектор У: 


Г Г то Т 
Ух = Вурц РЕ В ухи> Бор Ву; , Я 


Так как уги, =0 для і +, то 


или Ву =уїх, Ури = 1. 


Теперь вектор х можно представить следующим образом: 


п Ух Хх п > 
Х = м, = У (мх)ш 


Если элементы векторов являются вещественными, то в этой формуле под 
знаком суммы можно записать скалярные произведения: 


Продолжим пример, рассмотренный в начале раздела, и найдем левые собст- 
венные векторы матрицы, а потом убедимся в их биортогональности с уже 
найденными правыми. 

—51 49 


А = 
—50 —50 


Собственные значения: А = –100, А, =-1. 
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—51 -—50 У> | РЕ У 1 
—49 —50 У2 — У) 


Левые собственные векторы: 


—49 —50 |49: Ү12 


—50%) = —49у | —50ъ.> = 50У, 
У 2 = 22у —У21 = У22 
50 
–] 
Ур ай [ть 
50 


—49 
| Е 
Правые уже были вычислены: и; А 0 =| 50 |). 
| 


Проверяем биортогональность: 


49 49 
У, и. ) = -1-— + —.1=0 У, и! )}=-1:1+1:1=0 
( | 2) 50° 50 ( 2 ) 
49 99 49 99 
ц, У )=1+— = — и), У, ) = — +1 = —. 
(щу) 50 50 (шз) 50 50 
Нормируем скалярные произведения по одному из векторов, например по у: 
50 -50 
- 50 99 - _50 99 
99 49 99 50 
99 99 
Проверяем ортонормированность: 
~ 50 49 ~ 49 50 
Цу, | = — + — 1, М), У) = + — = 1. 
(ч.м) 99 99 (є,ю2) 99 99 


В заключение данного раздела предлагается самостоятельно убедиться в 
справедливости следующих утверждений: 


О собственные значения диагональной матрицы равны ее диагональным 
элементам; 


С собственные значения треугольной матрицы равны ее диагональным эле- 
ментам; 
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0 сумма всех собственных значений произвольной квадратной матрицы А 
равна сумме ее диагональных элементов (следу матрицы Тг(А)), а про- 


изведение всех собственных значений равно ее определителю 4еКА). 


ПЗ.4. Нормы матриц 


В конце приложения 2 каждому вектору уже ставился в соответствие скаляр, 
называемый нормой и характеризующий в некотором смысле "величину" 
вектора. Представляется уместным ввести аналогичную характеристику и 


для матрицы. Естественно сохранить обозначение А] и название — норма 
матрицы А. Введем это понятие аксиоматически. Пусть © — некоторый 
скаляр. Нормой матрицы |А называется число, удовлетворяющее следую- 


щим четырем аксиомам: 


О |] >0, А = () тогда и только тогда, когда А = 0; 


о |= |А; 


о 


А + В|<[А1+ 181; 
о АВА. 


Если дополнительно выполняются еще две аксиомы, то такая норма называ- 
ется канонической: 


о а» <А}; У; 


О если У, |а |< | то [А < [В]. 


Норма матрицы может быть введена различными способами. Во многих при- 
ложениях матрицы присутствуют одновременно с векторами. Поэтому целе- 
сообразно вводить норму матрицы так, чтобы она была разумным образом 
связана с используемой в данном случае нормой вектора. Так матричная 


норма [А] называется согласованной с данной нормой вектора, если для 


любой матрицы А и любого вектора х справедливо неравенство: 
Ах! < |А. 1х1: (13.3) 


Весьма актуальной представляется задача построения наименьшей нормы, 
согласованной с данной нормой вектора. Возьмем некоторую норму вектора 
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|х] и всевозможные векторы, имеющие единичную длину: |х| = |. На множе- 
стве таких векторов рассмотрим значения нормы вектора Ах: |Ах|. Среди 


величин [Ах] в силу непрерывности нормы обязательно найдется максималь- 


ная. Она и принимается за норму матрицы А. Определенная таким образом 
норма матрицы называется подчиненной векторной норме. 


[А] к [Ах]. (П3.4) 
Е, 


Оказывается, что эта норма удовлетворяет всем четырем аксиомам нормы и 
условию согласованности (3.3). 


То, что требование согласованности выполняется, устанавливается следую- 
щим образом. Пусть х * 0. Нормируем вектор х и рассмотрим вектор 


норм 


Хх ЧУ) < 
х =-— с единичной нормой. Вычислим [Ах] с учетом того, что 


хі 


Х = |х ОРМ 


[Ах = |А (|51. х"") 


КА | Ах'РМ 


\х| < (бир Ах" 


= АЈ 


Если х +0, то справедливость условия согласованности очевидна. Таким об- 
разом, векторная норма и подчиненная ей матричная нормы всегда согласо- 
ваны. 


Теорема. Норма матрицы, подчиненная данной норме вектора, не больше 
любой согласованной с той же нормой вектора: [АЙ < [А[. 


Доказательство. В силу непрерывности нормы всегда найдется вектор ху, 
такой, что |хо|=1 и |Ажо|=|А|,. Но |Ажо| <А, |х| = А1, и, значит 
ПА], < 1А, 


Можно показать, что для наиболее употребительных векторных норм 


| = 1, 1 = (55), |1, = тах 
т 


подчиненными являются следующие матричные нормы, обозначаемые теми 
же индексами, что и векторные: 


|А[ = пах ау. АБ = (©(А*д)) 


п 
А у=] 
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Исторически сложилось так, что в качестве норм используется много различ- 


ных чисел. Так существует вторая важная норма, согласованная со сфериче- 
1/2 


‚ Это [А]; = >> а — евклидова 
і=1 ј=1 


т 5 1/2 
ской нормой вектора |х, =(х, х) 


норма. Не трудно показать, что [А|| [А]. 


— это не просто нормы, а 
нормы канонические. Евклидова норма не может быть подчиненной никакой 
векторной норме, т. к. Е А = үп. Достаточно популярная М-норма 


А, 


[А], = и: пах! ау 


|х) 
|е 0) 


В качестве примера приведем доказательство согласованности одной из мат- 
ричных норм с векторной, а именно |А|_ с |х|. 


|х|, = тах|х|, [А|. = тах У); 
і і = 


ТУ" 


[Ах], = т 


аух,| Т а 


Уа 


=] 


- 


Я] она 


Доказательство согласованности других норм осуществляется аналогично. 


ПЗ.5. Матричный ряд и матричные функции 


В данном разделе речь пойдет об отображении, где областью определения 
функции является множество матриц, которые, как известно, образуют ли- 
нейное пространство и не только линейное пространство. При этом в качест- 
ве области значений выступает множество матриц. Возможно, более кор- 
ректным термином в данном случае был бы "оператор". Однако современная 
литература предпочитает слово "функция", по-видимому, вследствие боль- 
шого внешнего сходства матричных функций со скалярными. 


Наиболее простыми матричными функциями являются полиномы. Для по- 


строения полинома необходимо образовать степени матрицы А: АА. 
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А?, .., А”. Степени матриц определены лишь для квадратных матриц, и по- 
этому в дальнейшем речь будет идти только о них. По определению 


А^ =ААА...А (матрица умножается К раз) и А? =Е. Тогда матричный по- 
лином со скалярными коэффициентами су, су, ..., с, будет выглядеть так: 


Р (А) = сЕ + сА +с,А? +...+с,А”. 


Аргументом (область определения) является квадратная матрица размера 
тх т , и значением будет матрица (область значений) того же размера. 


Теперь устремим и к бесконечности, т. е. формально перейдем к бесконеч- 
ной сумме 


Р(А)= >. с,А*. (ПЗ.5) 
ү=0 


Такая сумма называется степенным матричным рядом относительно матри- 
цы А. Матричному ряду естественно сопоставить скалярный ряд 


р(х)= У, с,х. 
ү=0 


Матричный ряд будем называть сходящимся, если сходятся все т? скаляр- 
ных рядов для элементов матрицы Р(А). Введенное нами понятие нормы 


позволяет установить достаточное условие сходимости матричного ряда. 
Введем матрицу | =с,А!. Обозначим ее элементы за и), а элементы 
матрицы Р(А) за р, ;. Тогда с учетом выполнения шести аксиом для кано- 


нической нормы имеем цепочку неравенств: 


(910) (910) со 

(ү) (7) У = 

|рь,= Хи <> | У (од А 
ү=0 ү=0 у=0 


(113.6) 


со со А 
А" | АІ 
ү=0 ү=0 


В результате достаточным условием сходимости матричного ряда (П3.5) 
является выполнение условия 


|А < №, (П3.7) 
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являющегося, в свою очередь, условием абсолютной сходимости скалярного 
степенного ряда, стоящего последним в цепочке (ПЗ.6). Здесь А — радиус 
сходимости скалярного степенного ряда. 


Правильному пониманию условия (П3.7) способствует ответ на следующие 
два вопроса. Пусть имеется ряд с А =17. Сходится ли матричный ряд (П3.5), 
если 


А1 =24, /АІ, =18,  ДА]р =16; 


0 


[Ар =24, ПА, (А4, =17.5° 


00 


Необходимое условие сходимости матричного ряда рассмотрим несколько 
позже. 
Если матричный ряд сходится, то матрицу Р(А) будем называть матричной 


функцией (пока ограничимся матричными функциями только такого вида). 
Примерами матричных функций могут служить 


а АЁ _ = (А 
> т соѕ(А) = ти ОКУ ° 


ГА 2+1 
(-) А 


(24 + 1)! к=0 
Первые три ряда (матричные экспонента, косинус и синус), так же, как и их 


скалярные аналоги, сходятся для любых матриц, а последний ряд (геометри- 
ческая прогрессия) имеет А =1. Попутно легко убедиться, что 


ѕіп? (А) + со? (А) = Е. 


(А) = Д 


Для дальнейшего изложения необходимо ввести понятие подобных матриц. 
Определение. Пусть задана матрица А и некоторая неособенная матрица $ 


(т. е. е5) = 0 и существует $71). Всякая матрица В =$А$ ! называется 
подобной матрице А. Очевидно, что и А = $-'В$ подобна В. 


С точки зрения линейных преобразований можно сказать, что две матрицы 
подобны, если они соответствуют одному и тому же линейному преобразова- 
нию в различных базисах. Поясним, что это означает. В некотором базисе 
вектор х преобразуется в вектор у посредством матрицы А: у=Ах. Пере- 
ход к новому базису осуществляет матрица $, т. е. образы векторов х и у в 


новом базисе имеют вид: & = 8х и о = ёу. Умножив оба равенства слева на 
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$71, получим х=$ Е и у=$ 10. В новом базисе равенство у = Ах пре- 
вращается в $10 = АЅ Е ИЛИ 2=$АЗ Е. Это и означает, что матрица 


ЗАЗ! (подобная матрице А) осуществляет то же самое линейное преобра- 
зование, что и А , но в другом базисе. 


Сформулируем теперь несколько теорем о подобных матрицах и матричных 
функциях, устанавливающих некоторые свойства тех и других. 


Теорема 1. Подобные матрицы А и В =$А$! имеют одинаковые собствен- 
ные значения. При этом, если собственному значению А матрицы А отвеча- 
ет собственный вектор и, то у матрицы В этому же собственному числу А 
соответствует собственный вектор Зи. 


Доказательство. Так как 887! = Е, то 4е($$`') = 4еК$) дек$”") = декЕ) = 1. 
Для характеристических полиномов А и В имеем: 


де! (В-ЛЕ) = е (5487! –2557' )= 4е1($(А-^Е)$`")= 
= деК$) дег (А -ЛЕ)-деК$`') = де (А-ЛЕ). 


Характеристические полиномы для обеих матриц совпали, следовательно, 
совпали и их корни, т. е. собственные значения. Для доказательства второй 
части теоремы в равенстве Аи = Ам заменим матрицу А на подобную ей 


$ В$: 
$ Ви = ли. 


Теперь, умножив обе части равенства на $ слева, получим требуемый ре- 
зультат: 


В($и) =А($и). 


Теорема 2. Если матрицы А и В подобны, то их матричные функции также 
подобны. Иными словами, если В =$А5`', то (В) = ${(А)87!. 


К 
Доказательство. Первоначально определим В’. 


К 
В“ = ($А57' ) -$А$718А87!.8А87! – ЅАА..А$! –5А*85!, 


(В) = У с, В“ = 5 2. ел" 57 = $Г(А)$7'. 
к=0 к=0 
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Теорема 3. Матрица А простой структуры с собственными значениями ЛА, 
А, ... Аи подобна некоторой диагональной матрице А, на главной диаго- 


нали которой СТОЯТ собственные значения матрицы А $ т. е. 
А = Чтае (А, Ар, Я А. ). 


Доказательство. Пусть и, — собственные векторы матрицы А. Обозначим 
за О матрицу, столбцами которой являются все џи, . Тогда 


АЧ=А ц и, м |= | Ам, Аи, А. т 
|| | | | | 
в | | | | 
| | | м 0 о0о... 0 
Е | 00.0 
= 0, и 110 0 А 0 |= 0А. 


| ооо Л 


т 


Умножая полученное равенство поочередно справа и слева на 07 получаем 
требуемое 
21] _ 
А= ОАО, А = ОАО". 

Попутно заметим, что мы одновременно не только доказали теорему, но и 
определили матрицу преобразования подобия О, состоящую из линейно не- 
зависимых столбцов и, и, следовательно, неособенную. Не вдаваясь в под- 
робности, отметим, что в общем случае, при наличии кратных собственных 
значений у матрицы А, уже не имеющей простую структуру, вместо матри- 


цы А возникает клеточно-диагональная матрица, где каждая клетка пред- 
ставляет собой так называемый канонический ящик Жордана. 


Исключительно для простоты изложения дальнейшие теоремы будут доказы- 


ваться только для матриц простой структуры, однако результаты справедли- 
вы и для более общего случая. 


Теорема 4. Если собственные значения матрицы А обозначить через А, 
№), ... Ат» ТО собственными значениями матрицы (А) будут числа /(А.), 


ЈО), а. Лт) ' 
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Доказательство. А = ОАО!. По теореме 2 (А) = ОСАО. Представим 
(А) в покомпонентном виде 


уз СЕЛ 0 0 
к=0 
. 0 ?; СА Е 0 
КА) = У сд“ = и ы, 
к=0 4 " р . 
0 0 2 САА, 
к=0 
А) 0 0 
О0О 0) 0 
0 0 а У) 
И тогда 
РО) 0 ва 0 
0 105) .. 0 
А) = О (АО =. № 
о о...) 
что и означает, что Ѓ(Аџ), (А), ..., (Аи) являются собственными значе- 


ниями матрицы Ё (А), т. к. преобразование подобия не меняет собственных 
значений. 

Следствие 1. Из вышеприведенных формул непосредственно следует, что 
матричный ряд Ё(А) существует тогда и только тогда, когда существуют все 
скалярные степенные ряды, стоящие на диагонали матрицы ЃЁ(А), а у тех, в 


свою очередь, необходимым и достаточным условием существования являет- 
ся выполнение условий 


АДА, УА. (13.8) 


10 Зак. 3418 
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Таким образом, условие (П3.8) является необходимым и достаточным усло- 
вием сходимости матричного степенного ряда. На практике вопрос о сходи- 
мости матричного ряда решается в такой последовательности: 


(С сначала находится радиус сходимости К соответствующего скалярного 
ряда; 


(С затем проверяется выполнение условия (13.8) для всех собственных зна- 
чений. 


Следствие 2. Поскольку условие (113.7) является лишь достаточным услови- 
ем сходимости матричного степенного ряда, а условие (П3.8) необходимым и 
достаточным, то из совместного рассмотрения обоих условий легко заклю- 
ЧИТЬ, ЧТО 


ААА], (3.9) 


т. е. что все собственные значения матрицы не превышают ее любую канони- 
ческую норму. Формула (П3.9) будет многократно использоваться нами в 
дальнейшем. В ее справедливости рекомендуется убедиться самостоятельно. 


Теорема 5. Две любые функции матрицы А коммутируют между собой: 
КА)-Е(А)=Е(А).КА). 
Доказательство. По теореме 2 
Г(А) = О (А)О и (А) = 015 (А)О. 
В силу того, что диагональные матрицы всегда коммутируют, имеем: 


Е(А)е(А) = ОАО (А) = О (А)е(А)О = 


= О 2(А)Е(А)О = (АО (А) = #(АЖ(А). 
Теорема 6. (Формула Кели — Гамильтона). Всякая матрица удовлетворяет 
своему характеристическому уравнению. Пусть 
ОФА) = (1) ^" БА"! +...+5, —  характеристический полином, а 
О(А.) = 0 — характеристическое уравнение. Теорема утверждает, что 


О(А) = (-1)" А”+ЬА” +...+,Е = 0. 


Доказательство. Матрица простой структуры подобна диагональной матри- 


це: А = ОАО!. По теореме 2 о подобных матрицах А = ОАХО!. Подста- 
ВИМ В 


О(А) = (-1)" А"+ЬА”" +...+Б,Е 
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вместо А ее выражение через А: 
О(А) =(-1)" ОА" + 0А" 107! +..+6,Е = 
=0((-1)" л" А" ++ Е 0“. 


В скобках стоит диагональная матрица с характеристическими полиномами 
на главной диагонали, в которые подставлены собственные значения, и, зна- 
чит, тождественно равными нулю. Тогда матрица в скобках — нулевая, и 
теорема доказана. 


Теорема 7. (Формула Лагранжа — Сильвестра). Любая функция матрицы А, 

имеющей различные собственные значения, может быть представлена в виде: 

(А-ЛЕ)..(А-Л, ЕА – А, Е)... (А - А.Е) 
(А-А)... (А А) (А А)... (А А) 


Доказательство. Представим функцию (х) в виде интерполяционного по- 


КА)-> Уо) (П3.10) 


линома Лагранжа Ё, (х), взяв в качестве узлов собственные значения мат- 
рицы А: А, А, ..., А 


т 

Р(х) = 1, (х) +8, (х). 
Подставим в эту формулу А вместо х: 
КА) = 1, (А) + К, (А). 


Остаточный член К, (А) принимает вид: 


т-1| 
(т) 
в (А) =^— ока), 
т! 
где ©(А)=(А-ЛЕ)(А-^.Е)...(А-^Л„_Е)(А-^„Е). По теореме Кели — 
Гамильтона (А) = 0 и, следовательно, (А) =1,„ (А). 


т (А А.Е). (А-А, 1ЕХА – А, Е). (А А.Е) 
КА) = Е с АА АЕ НЕ нь ИНАН а АВВ 
2.7 и (А А)... (Лк АА — Мы). (А А) 


= $, ОВАЛ). 
к=] 


Теорема доказана. Отметим лишь, что матричные множители $, (А,Л,) для 
любых матричных функций остаются одинаковыми. 
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Формулу Лагранжа — Сильвестра можно модифицировать и на случай крат- 
ных собственных значений, осуществив предельный переход, при котором 
близкие собственные значения стремятся к общему значению. Приведем без 
доказательства формулы Лагранжа — Сильвестра для матриц второго и 
третьего порядка в случае кратных собственных значений. 


Матрицы второго порядка. А; = А,. 
О У матрицы один элементарный делитель: 
(А) = 10 )Е-+(А-^Е) (А). (П3.11) 
П У матрицы два простых делителя: 
КА) = (МЕ. 


Матрица третьего порядка. Л — кратности 2, А — простое. 


9 2 
С А; соответствует один элементарный делитель (А-А, }: 


ЛО. )Е + (А А АЕ) 


Ѓ(А) = 
(А) ЕЕЕ 


(А -А,Е) + Г) (А АЕ). 
(А5 – №) 
С А; соответствуют два элементарных делителя (А – А): 


А АЕ 


А, 
КА) = = 


А АЕ 
РО) 6—2 (А). 
0 = А 2) М-А2 | 


До сих пор мы ограничивались лишь такими матричными функциями, кото- 
рые представляются сходящимися степенными рядами. Расширим класс рас- 
сматриваемых матричных функций. 


Определение, Пусть матрица А не имеет кратных собственных значений, 
функция /(А) определена на спектре матрицы А (т.е. /(А) определена в 
точках Ау, А, ..., А„),а Еы1(х) — интерполяционный полином Лагранжа с 
узлами интерполирования А,. Тогда матричная функция {(А) равна 


Г. 1(А), т. е. имеет место формула (ПЗ.10). 


Как можно заметить на примере (П3.11), в случае кратных собственных зна- 
чений потребуется, чтобы в точках А, была определена не только сама 


функция /(А), но и ее производные до известного порядка, определяемого 


кратностью А, . 
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В качестве упражнения проиллюстрируем некоторые из рассмотренных тео- 


А _[-51 -49 
ем на примере матрицы = ; 
р римере матриц Ее" 


Характеристический полином ЯеЌА – АЕ) = А? +101А +100 = 0, № =-100, 
№ = -1. 

Теорема 4. Л, А. 

А : 100 –1. 

е^: е100е-1, 

е^! я е100 27! 

А-!: (100) !(–1)7'. 
А”: (-100)"(—1)”. 


АГА: (—100)(—100)(—1)(–1). 


очо осо 


(Е-А)': (1-(-100)) а- (1). 


Теорема 6. А? +101А +100Е =0. Воспользуемся этой теоремой для нахож- 


дения А-'. Умножим уравнение на А !: А +101Е +100А! =0 или 


А! = -(А +101Е)/100, 


А 1 ([[-51 —49 | 101 011 1150 —49 
2 1001-50 -50) {0 101]] 100\-50 51] 
Теорема 7. Имеют место равенства: 


А- Л.Е А-ЛЕ 
2 + (А5) > 
Еа ст 


А-»Е_ 1 ((-51 –49) (-1 0\\ 1 (50 49 

М =-А. 9911-50 50) (0 -1/} 99\50 49] 
А-МЕ 1 ((-51 -49\ [-100 0 \\ 1(49 49 
№ № 99\\-50 -50 0 1003) 991-50 50] 


4 _ 
аас осоо 1 (50 49] и 1[49 -49\ 
99450 49 991-50 50 


(А) = ЛОМ) 
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Следствие 2. Справедливо: 


[|| = тах У |а| = тах(101, 99) =101 
Ј 1] 


[А = (©(А* А) = (Аи ("^)) = ((-100)(-100))' ° =100; 


[А] ео у а,| = тах(100, 100) =100; 
Ј=і 


1/2 
[А] = р ЮЭ | = (517 +2. 50 + 49?) = (10002)? >100; 
= 
[А = т: тах|а,|=2.51=102. 
Как видно для всех норм, неравенство |А|2 |А выполняется. 


В дальнейшем мы будем широко пользоваться операциями дифференцирова- 
ния и интегрирования матичных функций скалярного аргумента по этому 
аргументу. Такие операции выполняются поэлементно: 


ЕЮ А50) .. В 
Е (г) 50) .. 5,0) 
Е"(/) = ) 
Б) Ер® .. Еж 
[Фа |5,00. . |5, (да 
[к Фа |5,(0а . . |5, (а 
[Е(0)а = 
[Е (дй [Е ‚(ан 2 [5009 
В частности справедливы следующие формулы: 
< (00).60)) = 20 0с) к(0)20, 
А 
ЯЕ (1) _ ае) рд уво) 0) тор. + Еб ото 
аі а! 
-1 
ЧЕ (1) _ оо. (1). 


аг 


Приложение 3. Элементы теории матриц 273 


Первые две формулы очевидны, третью рекомендуется доказать самостоя- 
тельно. 


П3З.6. Некоторые свойства 
матричной экспоненты 


Матричная экспонента является одной из наиболее употребительных мат- 
ричных функций, поэтому обратимся к некоторым ее свойствам. Их справед- 
ливость может быть установлена проведением ряда операций с матричными 
рядами. Опуская строгие доказательства, ограничимся лишь указанием путей 
их построения. 


Доказательство. Выпишем матричные разложения е^ И ев и перемно- 
жим их, ограничившись членами вплоть до квадратичных. 


2 2 
её .еВ = ЕНА+ +. Е+В+ > +.. 


2 2 2 2 
А АВ В” АВ 
= Е А+ —— +...+ВтТАВЕ——+...+—+ 

2! 2! 27021 

Теперь запишем матричный ряд для е^*В: 
А+В)? 
олер = БАВА НЕ 
и сравним ряды. В произведении е^ .еВ квадратичные слагаемые равны 
2 2 

А В 
ТТТ | а В разложении а они имеют ВИД 
(А+ В) А? АВ+ВА В: 
БЕ ы = 7 + Би + ЕА Совпадение будет, только если АВ = ВА. 


В общем случае, когда матрицы не коммутируют (АВ + ВА), 


В 


БА зе ей": 


274 Приложения 


А(г+ 
2. е. еМ ек9). Здесь [, 4 — скалярные величины. 


Доказательство. Воспользуемся предыдущими результатами. 


222 А? 2 
ее Е А+ Ад+ 1+ МАЧ + > +...= 
2 2 
ЕАО. 
А?(: +4)? ? . 
г) Аг а ЕАН. 


Здесь проблемы с коммутативностью матриц нет, и результат очевиден. 
= 
3. (е^ ) =е Р 


Доказательство этого свойства состоит в проверке равенства Ааа УЯ 


т.е. в непосредственном перемножении рядов для обеих матриц. Реко- 
мендуется выполнить эти преобразования самостоятельно. 


4. а ом = Ае^' =еМА. 


аі 
Доказательство. 
252 3,3 3,2 
СЕ БЕА а. ВАА +...= 
а! аі 2! 3! 
А22 3,3 
Ам +2 | 


Т 
5. [ем = А (АТ -Е) = (е^" -Е) АТ. 
0 
Доказательство. 


Т Т 2,2 3,3 2 27-3 
СХЕ а С В А А) 
) ) | 
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Умножим обе части равенства на А слева, а затем в правой части приба- 
вим и вычтем Е. 
рад 1253 
АТ АТ 
А Г ема = АТ + т 
0 | 


ее уе = [ча А (А7 Е). 


Умножение на А можно выполнить и справа, и тогда: 
А А АТ 1 
е ‘а =(е -ЕЈАТ 
0 


Выражение справа требует существования обратной матрицы А . Однако 
интеграл существует для любой матрицы. Если д4еКА)=0, можно исполь- 


зовать другой способ записи результата, ограничиваясь непосредственным 


-1 
интегрированием ряда без введения А . 


ПЗ.7. Аналитическое решение систем 
линейных дифференциальных уравнений 
с постоянной матрицей 


Рассмотрим систему обыкновенных дифференциальных уравнений первого 
порядка, разрешенную относительно производных 


ах (і 
и = у(х (р), х (0), „х (0), 1=1,2,..т 

где / — независимая переменная, х1) (г), х(2) (1), ..., х (Г) — искомые 

функции, ГАС, — функции, определенные на некотором открытом множестве 

С (т +1 )-мерного евклидова пространства переменных /, х0 (р), хб) (1), 0 


хб" (1). Номер компонента вектора здесь везде будем писать как верхний 
индекс в скобках. Перейдя к векторно-матричным обозначениям 


© (и, х) 


(2) 
(= х2) | 


к Г, х) 
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исходную систему перепишем в виде 
(1) 
аі 


При этом требуется найти решение х(/), удовлетворяющее начальным усло- 


2 (рх), (113.12) 


виям х(/у) = хо. Такая задача называется начальной задачей или задачей 
Коши. 


Важным классом дифференциальных систем являются линейные системы: 
ах (1) 


= (х (0) + а(х (0) +. +а,„ (х) (0) + 89 (0), 1=12,...т, 


где а, (1) и ғ“ (1) — непрерывные функции Е. Введя дополнительные обо- 


значения матрицы А(/) с элементами а’ (Г), а также вектора 


Т 
20) = (20900), 8200), ...870) ‚ получим уравнения в векторно-матричном 
виде: 


ах(1) 
а! 


Если а,; (1) = сопѕі, система называется линейной дифференциальной систе- 


= А (г)х(/) т о(/), х(/0) = Хү. 


мой с постоянной матрицей или постоянными коэффициентами: 


ах(і 
= = Ах(/) +2(1), Хх) = хо. (П3.13) 
Сначала обратимся к однородной системе 
ах(г) 
= Ах(} 
Е (2). 


Ее решением является функция х(1) = еле, где е — вектор произвольных 
постоянных. Убедиться в этом можно непосредственной подстановкой реше- 


А! 


а 
ния в уравнение. Выражение слева - (е с) = Ае^'с равно выражению спра- 
1 


ва Ае^! 


Неоднородная система решается методом Лагранжа вариации произвольных 
постоянных. При этом полагаем, что элементы вектора с являются функция- 
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ми независимой переменной с = с(!). Подставляем искомый вид решения в 


уравнение 
ас( 
Ае^'с(р)+е^' 0 = АеА'с(/) + р(/). 

Отсюда е^! 2200 ‚ и после умножения обеих частей равенства на е^“ 
получаем: 

а©(!) _ А, 

——=е Г). 

р в(!) 


Интегрируем это уравнение от к до 1: 
А 
(1) – е0) = [е "(т)ат, 
(0 
и, подставив с(Г) в искомый вид решения, определяем общее решение ли- 
нейной неоднородной дифференциальной системы: 
і 
х(ѓ) = е^'с(1)) + е^ Је А"р(т)ат 


10 


ИЕ: 
Учитывая начальные условия, находим вектор с(1): х(/) =хо =е (у) или 


с(/)) = а 9, и окончательно получаем: 


{ 
х(/) = ед0) + | ей9р(т)ат 


‘о 
Без нарушения общности можно считать, что начальным значением незави- 
симой переменной является к = 0. Тогда 
А А(/-т) А А 
[4 і-т і т 
х(/) =е ‘хо + [е о(т)0т=е хо + [е 0(1– т)ат. (П3.14) 
0 0 


Последнее преобразование использует теорему о свертке: 


і { 
[0 – т) (т)ат = | (т) (г – т)ат, 
0 0 
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в справедливости которой легко убедиться простой заменой переменной: 
Г = Та 


Считая вектор 2(Г) постоянным (2(/) = = сопѕї) , упростим равенство (П3.14): 
і 
х(/) = ех, + | ‚р = ех, + (е^ — Е)А в 
0 


Теперь запишем полученное решение в ином виде, воспользовавшись би- 
ортогональной системой собственных векторов матрицы А. Как и в 
разд. П3.3, правые собственные векторы будем обозначать и,, а левые — у,, 
і=1, 2, ..., т. При этом считаем, что векторы ортонормированы так, что 


Гу, = 1. Запишем разложения векторов х(/), 2(Г) и хо по биортогональной 


системе векторов матрицы А: 


х(/) = (к). ‚ (= У (в7%,). Ч, 


к = (хоу), А 7 0.5 ой т 


и подставим их в исходное уравнение (П3.13): 


У; |: Ц, = А(х7у,)-а, + (е7). 


і=] 


> 


Ц 4 


—. 
Влез 


Вынесем операцию дифференцирования за скобки и учтем, что Ац, = Аи, : 
т а т т 
=1 1=1 і=] 


Выпишем отдельно уравнение для і-ого компонента: 


(кту, = А, (ху, + (Ту, 


Это линейное дифференциальное уравнение первого порядка относительно 


скалярной функции (ху, |. Его решение с учетом начальных условий 


(х’у,) 


= (хоу) имеет вид: 
1=0 


(ом) (м) Ро (веот у) 


0 
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Окончательно для х(;) получаем 
х(/) = (е у, ‚м, -^ (хоу, )+ е Аг ти (ПЗ.15) 


=] 


Сравнивая два решения (113.14) и (П3.15) и учитывая формулу (13.10), мож- 
но связать матричные множители в формуле Лагранжа — Сильвестра и соб- 
ственные векторы и; и у;. Выпишем первые слагаемые в обеих формулах, 


определяющие решение однородной системы: 


х(1) = ехо = Уе 5 (А, А): хо, 
= 
(П3.16) 


т т 
ли т т 
х(/) = Уеа (хо у) = Уе и, (у; хо). 
= і] 


Отсюда $, (А,А;) = ц, -У,. 


ПЗ.8. Аналитическое решение систем 
линейных разностных уравнений 
с постоянной матрицей 


Рассмотрим линейную систему разностных уравнений с переменными коэф- 
фициентами или переменной матрицей 


| А | 
у (+1) = (ЮУ (+ (ЮУ (0) +... +6, (ЮУ ОЮ) + 607 (0), 
15:25 Уе 

где К — независимая целочисленная переменная, У (Е) — искомые функ- 

ции, 6, (К) и ғ‘ (к) — заданные функции целочисленного аргумента. 


Введя дополнительные обозначения матрицы В(К) с элементами 60), а 


также векторов Уу(А) и (К) 


уб) (ую, у ую), в (2900,00), в"). 
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перепишем систему в виде 
У(А +1) = В(А)у(К) + (К). (П3.17) 


Функцию у(^), удовлетворяющую при & = 0, 1, 2, ..., и, ... уравнению (П3.17), 
называют решением линейной разностной системы. Если заданы значения 
функции у(/) в некоторой точке ко: 


Т 
У) = (39 (0), уб) (А), а У" (к) ‚ то говорят, что относительно раз- 


ностной системы поставлена начальная задача (аналог задачи Коши для 
дифференциальной системы). Начальные условия из бесконечного множест- 
ва решений разностной системы выделяют одно, проходящее через эту точку. 


Если коэффициенты матрицы постоянны: 5,,(Ё) = сопѕї = ,., 


ностной системе с постоянной матрицей. Приступим к решению неоднород- 
ной разностной системы, относительно которой поставлена начальная задача: 
у(0) = уџ. Начинаем с однородной системы 


У(А +1) =ВУу((). 


то говорят о раз- 


Ее решением является функция у(К)= В^е, где с — вектор произвольных по- 
стоянных, что непосредственно проверяется подстановкой предложенного ре- 


шения в уравнение: выражение слева ВАС равно выражению справа ВВ*с. 
Неоднородную систему 

у(К + 1) = Ву(к) + (К) (П3.18) 
решаем методом вариации произвольных постоянных, т. е. полагаем с = с(Х). 


Искомый вид решения у(&) = В“ с(К) подставляем в уравнение 
Вок +1) = ВВА) + (©). 


Группируя слагаемые, получаем В“ лек) =2(^) или Ас(Е)= В“) | 
Суммируем последнее равенство 
4-1] ҝ-1 | 
У. Ае) = с(к) – с (0) = УВ” #(2) 
і=0 і=0) 
и для решения у(&) имеем 
к] 


(Е) = В*е(0) + В‘ У ВТ 1р(7). 
1=0 
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Для нахождения вектора произвольных постоянных ©(0) воспользуемся на- 
чальными условиями и получим у(0) = у, =с(0) и 


к] | А 
у(к)= В^у(0) + У В''е(7) = В^у(0) + У В'в(к -1-1).  (П3.19) 
1=0 1=0 


В последнем равенстве изменением порядка суммирования получается резуль- 
тат, аналогичный тому, что дает теорема о свертке в непрерывном случае: 


1 | 
Ув 1600) =В 1000) + В“ 2р(1) +... + В!в(& – 2) + ВОр(к 1) = 
і=0 


0 к-2 к—1 ае 
= В 0(4-1) +В о(&-–2)+...+В (1) +В (0) = У В'е(–/– 1). 
і=0 
В частном случае, когда 2(К) = соп${ = 9, этот вектор можно вынести за знак 
суммы: 


к. _ 
У(® во) Ув = В*у(0) + (В* -Е)(В-Е) "=. (П3.20) 
і=0 
Последнее выражение было записано с учетом очевидного равенства. 
к-1 
вв) бв) (в -Е). 
1=0 
Как и в предыдущем разделе, решение может быть записано с использовани- 
ем биортогональной системы собственных векторов. По-прежнему считаем, 


Г 
что выполнено нормирование, т.е. и; у, =1. Выписываем разложения векто- 
ров у(/), 2(К) и уу по биортогональной системе векторов матрицы В: 


у(А) = Ху’) ; (К) = (еюм). и; Уо = У (уву) 
и подставляем их в уравнение (113.18): 
(ут + у, | = У в(у 0, > (ЕР, 


|= 
Учтем, что Ви, = Аи, и выпишем уравнение для 1-ого компонента: 
С +1, = А, (уг (Юу, т (87 (юу, . 


Это линейное разностное уравнение первого порядка относительно скаляр- 
ной функции (уу, ). 
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С учетом начальных условий (у 00у, ), та (улу) его решение имеет вид: 
к-] 
(уу, )= А (усу, | + У АР (87 (ру, 
р=0 
И, наконец, получаем выражение для у(К): 
т т К) 
(К) = У (У 00у, и; = н (убу, + УАР (87 (р)у, ) цу. 
і=і і=] р=0 


Как и в предыдущем разделе, здесь можно воспользоваться теоремой о свертке: 
т П т К] т 
У(А) = $ (уду, )+ 3 АР ( (А -р-1)ғ, } "Ц;. 
[= р=0 


Таким образом, решение системы линейных дифференциальных и разност- 
ных уравнений может быть представлено как через матричные функции, так 
и посредством биортогональной системы собственных векторов. 


В завершение раздела проиллюстрируем приведение линейных дифференци- 
альных и разностных уравнений порядка выше первого к системе уравнений 
(табл. П3.1). 


Таблица ПЗ.1. Приведение линейных дифференциальных и разностных уравнений 
порядка выше первого к системе уравнений 


205) (г) = 9270 (1) + а2(°72) (2) + ук+ 5) = Б у(к +5 1) + р, у(к+5– 2) 
+ ...+а,2(1) + 200) +... НБ, У(К) + 8 (К) 


Начальные условия 


2(0), 2 (0), ..., 26°) (0) у(0), 21), ..., у(5— 1) 
20) = 600) УЕ) = (К) 


2()=6,(0) Уу(Е +1) = 0,(0) 
Есі 
20800) = 6 (и) У(К+5-ПШ=о, (К) 
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Таблица ПЗ.1 (окончание) 


Тогда 


10) =2 0) = 600) о +1) = (Е +1) = 0, (0) 
6200) =2 (0) = 6300) о,(Е+1) = (+2) = 0з (К) 


о, (+1) = у(Е+ 5) = 
= Б 0() +6, 10 (К) + 
+ +Бо, (©) + (К) 


60) = 2090) =а,6 (0) +а, 16200) 
+ ...+а6, (0) +201) 


Осталось лишь использовать матрично-векторные обозначения и уравнения 
переписать в таком виде (табл. П3.2). 


Таблица ПЗ.2. Использование матрично-векторных обозначений 


Дифференциальное уравнение 


30 = Ас) +800), $00), где 


Разностное уравнение 


(А +1) = Въ(к) + 2(^), 000), где 


с (1) 
62 (1) 0 
$00) =| ... |580 =... | 


51 (А) 
25 (К) 0 
(К) =! ... |; #(К)=| ... | 


65 (1) о, (К) 
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Нумерацию новых функций при замене можно произвести и в другом поряд- 
ке, начиная с 2051 (Е) и у(+5-1). Тогда матрицы А и В и векторы С<(/), 
(К), 2(Г) и (д) будут иметь несколько иной вид. 


П3.9. Устойчивость решений 
дифференциальных и разностных уравнений 


Обратимся к системе нелинейных дифференциальных уравнений 


ах( 
0 тах) х(/0)=хо, іє[а, 6], (П3.21) 
где / — независимая переменная, х — вектор решения; #(/, х) — вектор- 


функция, непрерывная по /ѓ и имеющая непрерывные частные производные 
первого порядка по компонентам вектора х. 


Большой интерес представляет исследование зависимости решения задачи 
Коши от начальных условий. Если незначительные изменения в ху могут 
существенно изменить решение, то в прикладном отношении такое решение 
часто неприемлемо. На конечном промежутке [а, 5] для систем (ПЗ.21) с 
непрерывной функцией #(1,х) и свойством единственности решения имеет 


место интегральная непрерывность решений. Иными словами, для любого 
=> 0 существует такое ӧ > 0, что для любых двух решений х(/) и 2(/) сис- 


темы (П3.21), отличающихся начальными условиями не более, чем на 6 
(|00) – 200)1< 8), будет иметь место (х0) – 20| < е). Иначе обстоит дело 


для бесконечного промежутка при { > ©. Изучением этих вопросов занима- 
ется теория устойчивости. 


Определение 1. Решение х(Г) системы (13.21) называется устойчивым по 
Ляпунову, если для любого є > 0 найдется такое ё > 0, что для всех решений 


2(1) системы (13.21), удовлетворяющих неравенству (100) –200)1< 5), 


справедливо неравенство (х0) — (1) < =) при всех #еЕ[4,50). 


(М=>0)(35>0)(\2(1)) (уге [4,°)) (|х(%)-2(1)|< 8 = 


П3.22) 
> |х(0)-20)| <). 
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Иными словами, решение х(Г) называется устойчивым, если другие доста- 
точно близкие к нему в момент времени {у решения 2(Г) целиком находятся 
в узкой =-трубке, построенной вокруг х(/). 

Определение 2. Решение х(/) системы (П3.21) называется асимптотически 
устойчивым по Ляпунову, если оно устойчиво и существует такое А > 0, что 
все решения 2(/), удовлетворяющие условию (х0) 20)|<А), обладают 


СВОЙСТВОМ 
іт |0) 20) = 0. 
1—90 


В случае асимптотической устойчивости близкие решения не только оста- 


ются близкими друг к другу, но и неограниченно сближаются при возрас- 
тании /. 


Для определения неустойчивого решения достаточно построить отрицание 
определения 1. 


Для систем разностных уравнений 
у(п+1) =в(л,у(и)), у(по) =уо, пє[ло, 9%) (П3.23) 


понятие устойчивости вводится аналогично предыдущему с заменой незави- 
симой переменной { на целую переменную и. Обозначим за у(п) и (п) два 


решения (113.23), отличающиеся начальными условиями у(иу) и м(пџ). 

Определение 3. Решение у(п) называется устойчивым, если для любого 
=>0 найдется такое ӧ>0, что для всех решений м(и) системы (ПЗ.23), 
удовлетворяющих неравенству (70%) -м(т)|< 5), справедливо неравенст- 


во (УС) _ м(л) < е) при всех иє[по, о) 


(є > 0)(35 >0)(Ум(и))(Улє [ло,оо)) (Сто) –м(л){ <= 


(113.24 
= [у(и) – м(и)| <). | 


Понятие асимптотической устойчивости предлагается определить само- 
стоятельно на основе определения 2. 


Сформулированные определения позволяют сделать суждение об устойчиво- 
сти после анализа уже полученных решений. С практической точки зрения 
важно судить об устойчивости, не решая задачу. 
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Это возможно, в частности, для линейных систем с постоянной матрицей 
(113.13): 


ах(1) 


= Ах(/) +0(/), х(/)) =х/. 


Будем называть их устойчивыми (асимптотически устойчивыми, неустойчи- 
выми), если все их решения устойчивы (асимптотически устойчивы, неус- 
тойчивы). 

Пусть х(/) и 2(/) — два различных решения (П3.13), отличающиеся началь- 
ными условиями. В соответствии с (13.14) они имеют вид: 


1 


[ 
(тат =е^' хо + [е^'о(х –т)ат, 
0 0 


М І 
100) = ема + [ели р(т)ат = елд + [е^ в – т)ат. 
0 0 


Вычтем из первой формулы вторую. После сокращения интегралов получаем 
А! 
х(!)- 2(1) =е (хи -20). 


Пусть первоначально собственные значения матрицы А различны. Тогда, 
используя для матричной экспоненты формулу Лагранжа — Сильвестра 
(113.10), имеем 


х(1) 200) =е (хо -20)= уе, (А, (хо 20). 
к=] 


Обращаясь к определениям 1 и 2, приходим к выводу о том, что для обеспе- 
чения неравенства (|0) – 20) < =) элементы матричной экспоненты при 


[—> оо должны быть ограничены. А это, в свою очередь, требует, чтобы ве- 
щественные части Ке(^,) собственных значений были бы неположительные. 


Для асимптотической устойчивости условие т |х(г) – 201) = () выполняется, 
1—у°0 


когда элементы матричной экспоненты при #-— о стремятся к нулю, а веще- 
ственные части собственных значений, соответственно, отрицательные. 


Если среди собственных значений есть кратные, условия несколько коррек- 
тируются. Пусть, например, собственное значение А, имеет кратность 5. То- 
гда в решении этой группе собственных значений отвечает слагаемое 


Р, (е, где Р, (і) — полином степени 5-1. Если для Ве(л,)<0 асим- 
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птотическая устойчивость обеспечивается независимо от кратности корня 
(Р, (е —>0 при іо), то при нулевой вещественной части 


Р, 101) >> +оо при # —> о и условие (|х) -- 202) < =) не выполняется. 


Подведем итоги. 


О Для асимптотической устойчивости необходимо и достаточно, чтобы для 
всех собственных значений выполнялись условия Ке(/.,)<0. 


С) Для устойчивости необходимо, чтобы Ке(л,) < 0. При этом достаточно, 


чтобы среди собственных значений с нулевой вещественной частью не 
было бы кратных. 


О Для неустойчивости необходимо наличие хотя бы одного собственного 
значения с Ке(А, ) > 0 или кратных собственных значений с Ке(л,) = 0. 


Теперь обратимся к системе разностных уравнений с постоянной матрицей: 
у(и+1) = Ву(и) + в(и). 


Пусть у(п) и м(и) — ее два различных решения, отличающиеся начальны- 
ми условиями. В соответствии с (П3.19) они имеют вид: 


п-1 п-1 
у(п) = В"у(0) + У В" (К) = В"у(0) + У Вёр(п к 1), 
К=0 к=0 


(п) = В" (0) + у В" 12 (К) =В" (0) + у В’2(п-К-П. 
к=0 к=0 


Вычитая из первой формулы вторую, после сокращения сумм получаем: 


И 
у(и) – м(и) = В" (уо №). 
Если все собственные значения матрицы В различны, то, воспользовавшись 


формулой Лагранжа — Сильвестра для В”, имеем: 
т 
п 
у(п) –м(л) = >, 8; (В, )(уо о), 
к=] 
где р, — собственные значения матрицы В. Аналогично предыдущему для 


обеспечения неравенства (уо) – мт) <) элементы матрицы В” при 


п > о должны быть ограничены. А это, в свою очередь, требует выполнения 
условий || <1 для всех собственных значений. Для асимптотической устой- 
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чивости неравенства должны быть строгими: ш |< 1. Если собственное зна- 
чение ц, имеет кратность 5, то, как и для дифференциальных уравнений, в 
решении появляется слагаемое Р, (п): рү, где Р, (и) — полином степени 
5—1. Для || <1 этот факт не оказывает влияния на условие устойчивости, 
но ДЛЯ ы |=1 условие устойчивости нарушается, если Р._/(п)-— +оо при 
п > ©. Как результат, сформулируем условия устойчивости. 


О Для асимптотической устойчивости необходимо и достаточно, чтобы для 
всех собственных значений выполнялись условия || <1. 


О Для устойчивости необходимо, чтобы П <1. При этом достаточно, что- 


бы среди собственных значений с единичными модулями не было бы 
кратных. 


С Для неустойчивости необходимо наличие хотя бы одного собственного 
значения с | > 1 или кратных собственных значений с |р, | =1. 


Глубже осознать понятие устойчивости позволяет ответ на следующий во- 
прос. 


ВОПРОС 


В какой взаимосвязи находятся понятия "устойчивости" и 
"ограниченности"? Имеются четыре варианта ответа. 


• Из устойчивости решения следует его ограниченность. 
• Из ограниченности решения следует его устойчивость. 


• Оба предыдущих факта имеют место и по сути свойства ограничен- 
ности и устойчивости весьма близки. 


• Это различные понятия. Из ограниченности решения еще не следует 
его устойчивость и из устойчивости не следует ограниченность. 


ПРИЛОЖЕНИЕ 4 


Степенные 
асимптотические разложения 


Наиболее употребительным и известным степенным разложением функции 
у(х) является ряд Тейлора. Это далеко не единственное степенное разложе- 


ние, и для получения других используем общий подход, предложенный 
Ю. В. Ракитским, на основе метода неопределенных коэффициентов. Рас- 
смотрим формулу Ньютона — Лейбница, в которой под интегралом выпол- 
нена замена переменной 1 =/+й-т: 


п Дх( +й-т) ж; 


аы ЕХЕ а Етте 


і 


Обозначение производной в последнем случае подчеркивает, что дифферен- 
цирование проводится по всему аргументу. Далее, внесем под интеграл мно- 
житель 1 и произведем интегрирование по частям: 


" ах(і + – 5 т о 
1+7) =х( 14 ——————— —^ 
х(1+ №) ко. [| пс, дев) и Ш 7 
ах(г) ах(1+ А) а2х(1+Аћ- т) 
= х) (АС) т 7и + те а ат, 


где Су — произвольная постоянная. 
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Продолжая интегрирование по частям 5 раз, каждый раз вводя новую постоян- 
ную, найдем общее степенное разложение: 


х(1+ й) = е) С Е. 
а! а! 
д? р ($) 
{* +С! нс, | (1) (П4.1) 
ћ 5—] 5+1 _ 
– Сх (+) + |+ с 
(80), а0 +8 т) 
Выбором произвольных постоянных С,, Ё = 1, 2, ..., 5 можно получить раз- 


личные асимптотические разложения. В частности, если в (П4.1) выбрать все 
С, нулевыми, то будем иметь хорошо известный явный ряд Тейлора. 


ахї о де п 5 ЖЕНИ 
х(/) 0 (9 (Р) – |= а хі+А-т) (П4.2) 


х(+ А) = х() н 0 +... + х 
РРС 5) 051 аи +)?" 


к 


Определение С, по формуле С, 2 позволяет обратить в ноль все ко- 


эффициенты при производных в точке г: 


5 5-| 5 ка 
Вб, 2 кс, = 0 
61 18-1)! 5! 2! 


и получить неявный ряд Тейлора: 


аи+т кю В 
а 


г У” х (+ А), (14.3) 
і 


х(1+ й) = х(ѓ)+А 
Важное место среди степенных разложений занимает формула Эйлера — 
Маклорена, для построения которой необходим ряд сведений о числах и 
полиномах Бернулли. 


А е а 
Функция с ое называется производящей функцией для чисел 
ехр(/) — 


Бернулли. Это означает, что коэффициенты В, ее разложения в ряд будут 
числами Бернулли: 


С(г) = = У Век |А < 27. 


е1 5 
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Для их нахождения умножим последнее равенство на (е 1), представляя е' 


в виде тейлоровского разложения: 


Е. 
[= Ве В. [оби Ваһ.) 
210! 21 3! 


Перемножая два ряда в правой части равенства и приравнивая коэффициенты 
при одинаковых степенях /, получаем формулы для нахождения В, : 


Вә = , 30 +2. › 
0121 11! 
Во ео В! 0. = 2035. 


2 = 
0151 115—1)! (5 –1)11! 


Умножая последнее равенство на 5! и прибавляя к обеим его частям по В, , 
приходим к выражению 


О К В. ж Е 
= В. + + Е +В), а 
и З а 


для запоминания которого используют мнемонический прием, основанный 


на сходстве этой формулы с биномом Ньютона (В + 1’ 
В, =(В+1)ў, 


Здесь подразумеваем формальное применение бинома Ньютона с перенесе- 
нием показателя степени у В в индекс (В; вместо ВЎ ). Теперь без труда вы- 
числим сами числа Бернулли: 


1 | 
—. №0. Визе, ВО В 

2 6 > 6 42 

ый. Б Во №. 

МАЕ в 


ИТ. Д. 


Нетрудно показать, что все нечетные числа Бернулли, начиная с третьего, 
равны нулю. Действительно, 


—1 _ Ё-ехр(р) 


Ре ехр(-г)-1] р ехр(ѓ) – 1 


= +600). 
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Раскладывая все функции в ряд, убеждаемся, что равенство В, (0) = Ви 
возможно лишь при В... = 0, К=1, 2, 

Для построения полиномов Бернулли В,(х) рассмотрим производящую 
функцию Н(Ьх): 


Н(е,х) = ехр(х0)С(0) = рта ‚ И<2м. 


Раскладывая ехр(х!) и С(/) в ряд и приравнивая коэффициенты при одина- 


ковых степенях ;“, получим равенства 


вух) =1, 89 - Во. Ві. 


1! 011 110!’ 
В: _ Во оз В: 5. Ве. 
5! 015! (== 1)111 510! 


умножая которые на 5! приходим к формуле 
5 5 | 5—1 5 
В; (х) = Вох в(1 [в 


И снова удобно воспользоваться мнемоническим приемом В,(х) =(х+ Ву}. 


Здесь индекс опускается только у чисел Бернулли В,. Непосредственное вы- 


числение позволяет записать: 
1 2 ] 
Ву(х) =1, ов В,(х) = х Еа 


При этом числа Бернулли — это соответствующие полиномы Бернулли в ну- 
левой точке В, = В, (0). 


Теперь обратимся к построению формулы Эйлера — Маклорена, выбрав 
произвольные постоянные С, таким образом, чтобы полином, стоящий под 


интегралом в (14.1), был связан с полиномом Бернулли следующим образом: 


5 5-1 ре 
Ч Е нс _ Вт! ®)- В, Вз рз. 


К ПЕТТ 5! 
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Параметры С; находятся из сравнения полиномов в правой и левой частях. 
Раскрывая полином в правой части 


ро Вт! 7) - В, _ Вот’, ВИ", Ватт" 
5' 5 ИИ “о (5-0) 


) 


имеем 


Рассмотрим подробно коэффициенты при А-ой производной, предварительно 
подставив в них выражения для Су: 


к к-1 к 
а ВИ ВО ра е о ав В 

к И (А-1)! К! 01! 1104-1)! (А-1)! А! 
Сумма первых К членов в скобке равна нулю и при /-ой производной оста- 
нется лишь множитель ДВ, /К!. Полином же при 5-ой производной обращается 


в ноль, т.к. С, =0. С учетом этих рассуждений степенное разложение при- 


нимает вид: 
ку М, уат (0+ х0)» 
рэ " а + 0. 
+В е. в.) з пу. 


ах(і + т) 


Произведем замену переменных = (Е +7). Тогда 


р 
х(Ё+ В) (0) = | (+ ат, 
0 


а степенное разложение в новых обозначениях выглядит следующим обра- 
зом: 


јаз - уе = 76 +в) |+ 


| " В В 1 –1) ы 
р” а +А-т 
и 5, агути у 
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и называется формулой Эйлера — Маклорена. При 5=1 и 5=2 она пре- 
вращается в малые квадратурные формулы левых прямоугольников и тра- 
пеций. 


Возможно получение и составных квадратурных формул. С этой целью разо- 
бьем промежуток [а, Ь на Л промежутков длиной Й, для каждого из них 


применим формулу Эйлера — Маклорена и просуммируем результаты: 


|у нен, 70) рр у +) 79а) |+ 


1=0 к=] 


ку г ваю В.) + т)ат, 
і=0 5 


Р -а 
=. 


д = 


Изменяя порядок суммирования, получаем: 
а У уа), Ви Ви ра Э) 70а) |+ 
к= 


56 вк Вох Р, + а т)ат. 


і=0) 


Последняя формула может быть использована не только как квадратурная, но 
и для вычисления сумм через интегралы. Выберем 


Ла) =т?, А=1, т =0, тур=М-1, з= р+1. 


При таком значении 5 остаточный член обращается В ноль, тогда для суммы 
имеем: 
М№-1 р+і В ВрР! Е В | 
2 р +1-&Р. 
20 р+1 1! 2! р! Ш (р +1 КА! 


В качестве примера конкретизируем последнюю формулу для р =3: 


У вем _ №833! , у? В23! уз ВВ! ра Воз М ММ МАМЫ 
МЕТ 212! 113! 014! 4 2 4 4 | 
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Исключительный интерес представляет формула Дарбу — Обрешкова, полу- 
чаемая из общего разложения (114.1) путем выбора коэффициентов С, на 
основе полиномов Лежандра: 


5 5—1 5 
Со неет ИЕ Е. (2 -т). 
5! (5 — 1)! (25)! дт? 


Разложение в этом случае приобретает вид: 


р 51 (25-0)! 


= ры (К) 
0+ У т сср, и + и) + 0000) |+ 


р25+! | А Е РТТ (П4.5) 
+ |00 р) х" (+ рй)ар. 
(25)! и 


Эта формула обладает рядом специфических особенностей. Во-первых, ко- 
эффициенты разложения зависят от числа учитываемых членов $, что не на- 
блюдалось для (П4.2)—(П4.4). Во-вторых, число учитываемых членов раз- 
р25+! 


ложения равно 5, в то время как остаточный член имеет множителем и 
содержит производную порядка (25 +1). Последний факт указывает на пре- 
дельно высокую точность формулы Дарбу — Обрешкова. 


В качестве иллюстрации рассмотрим, как приближается функция е* разло- 
жениями ([14.2)—(14.5) с $5=Ги5=2. 
Явный ряд Тейлора (114.2): 

2 


6 =1: ея х; ғ=2: ех. (4.6) 
Неявный ряд Тейлора (114.3): 
=! ро = Зее ИА 
[-х ҳ? (П4.7) 
У 


Формулы Эйлера — Маклорена и Дарбу — Обрешкова, как нетрудно убе- 
диться, для 5 = 2 совпадают: 


НХ. 


ео ао 
ых. 


ао о 


(114.8) 


и начинают различаться с 5 = 3. 
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Формулы (П4.6)—{П4.8) хорошо известны при анализе устойчивости чис- 
ленных методов решения дифференциальных уравнений. Приближение 
(114.6) характерно для явных методов Рунге — Кутты с известным ограниче- 
нием на шаг интегрирования, что пагубно сказывается при решении жестких 
систем, а приближение (П4.7) — для неявных методов (см., например, неяв- 
ный метод ломаных Эйлера). При больших по модулю отрицательных значе- 
ниях х формула (П4.7) обеспечивает качественное сходство исходной функ- 


ции и разложения, убывая с ростом |х|. Приближение (114.8) для 5 =1 отвеча- 


ет неявному методу трапеций, чья область устойчивости в точности равна 
левой полуплоскости. Этим же свойством обладают и методы, построенные 
на формуле (П4.8) с 5=2. Ее погрешность в приближении экспоненты про- 


порциональна р”. 


В заключение рассмотрим следующую задачу. Пусть задан промежуток 
[а, Ь]. Для е! по трем равноотстоящим узлам к =а, ў =(а+5)/2, 15 =Ь 


построим интерполяционный полином Лагранжа второй степени. Воспользу- 
емся также для ехр(/ + й) приближениями по формулам (П4.2) и (П4.3) с 


5=2 и приближением (П4.5) с 5 =1 в точке ѓ = а. Все четыре аппроксими- 
рующие функции имеют в остаточном члене третью производную. 


ВОПРОС 


Какое из этих приближений лучше всего описывает исходную функцию 


ехр(/ + й) для 0 <А<Б-а? 


ПРИЛОЖЕНИЕ 5 


Практические занятия 


В рамках курса "Вычислительная математика" предусмотрены упражнения, 
лабораторные работы и курсовая работа. Примерное их содержание отраже- 
но в данном приложении. 


П5.1. Упражнения 


П5.1.1. Введение 


Цель данной темы — выработать у студентов представление о том, что очень 
многие проблемы решаемых задач возникают по причине ограниченной точ- 
ности представления чисел с плавающей точкой в компьютере, а также по 
причине погрешности задания исходных данных. Здесь весьма полезно рас- 
смотреть ряд типовых примеров того, что сложение на компьютере может не 
обладать свойством ассоциативности. При этом в ряде случаев погрешность 
имеет недопустимо большую величину. Представляется полезным также ре- 
шить следующие две хорошо известные задачи. 


Задача 1 (более подробно см. [14], с. 29). Пусть требуется определить значе- 
ние Ро, где Е, представляет собой следующий интеграл: 


| 
Ре [хе ах. 
0 


Интегрируя по частям 


Бу [хте ах = х"ех 1 


| 
02 их" ‘е’ ах 
0 0 
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получаем рекуррентную формулу для определения Е: 


Еһ=пЕ, 1, п= 2, 3, те, 9. (П5.1) 


Задавая Еј с точностью в шесть десятичных разрядов и выполняя в даль- 


нейшем все вычисления по формуле (П5.1) без дополнительных округлений, 
получаем ХЕ, =-0.0684800. Так как вычисляемый интеграл положителен для 


любого и, ясно, что всего за восемь шагов погрешность стала недопустимо 
большой. В то же время, переписывая формулу (15.1) в виде 


2924 
И 


Е 


п-1 


(П5.2) 


и грубо полагая Е, = 0, после одиннадцати шагов получаем вполне удовле- 
творительный результат Ё = 0.0916123. Этот пример — первое знакомство с 


устойчивыми и неустойчивыми алгоритмами. Перенос известного метода 
интегрирования по частям на компьютер в условиях ограниченной точности 
исходных данных дал негативный результат. Важно отметить, что замена ал- 
горитма (115.1) на любой устойчивый метод позволяет решить все возникшие 
проблемы. 


Задача 2 (более подробно см. [49], с. 37). Требуется решить следующую сис- 
тему линейных алгебраических уравнений Ах = Б, где элементы матрицы А 


и вектора Ъ заданы с предельной абсолютной погрешностью == 0.005 и 
принимают следующие значения: 


1.00 0.99} 1.99 


0.99 0.98] 1.97 |. 


С одной стороны, точное решение этой системы имеет вид х = (1.00, 1.00)”. 


С другой стороны, если подставить в систему совсем другое решение 


х = (3.0000, 1.0203)" ‚ то вектор Б оказывается весьма близким к исходно- 


му Ь = (1.989903, 1.970106)". Наконец, если в матрице А совсем немного 


изменить элемент 2, =0.98015, то решение принимает следующий вид 


Г 
х = (3.97, – 2.00) . Здесь важно отметить, что в возникших проблемах "ви- 


новата" задача в своей постановке, ее решение очень чувствительно к по- 
грешности в исходных данных, и смена метода не позволяет изменить ситуа- 
цию (подробнее см. разд. 2.1). 
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П5.1.2. Погрешность арифметических операций 


Эти вопросы, не отраженные в курсе лекций, необходимо подробно разо- 
брать на упражнениях. Материал традиционно хорошо освещен в многочис- 
ленных учебниках (в частности, см. [1, 2]). Как результат, важно отметить, 
что основные неприятности связаны с операцией вычитания и, в первую оче- 
редь, с вычитанием близких чисел, когда происходит исчезновение верных 
разрядов числа. Среди многочисленных иллюстраций на эту тему могут быть 
следующие примеры. 


Пример 1. Вычисление значения х по формуле х= 7 – 48.99 существенно 


0.01 
лучше заменить на формулу х = ———= , где отсутствует вычитание близ- 
ы Ф 7+ 448.99 4 и 


ких чисел. 


Пример 2. Требуется вычислить корни квадратного уравнения 
х? + рх +9 = 0 для следующих значений параметров: р = 20 000, 4 =1. При 
этом вычисления проводятся на компьютере с относительной погрешностью 


порядка є ~ 10-7. Вычисляя корни непосредственно по известным формулам 


получаем явно ошибочное нулевое значение х, : 


ху =-10* – 10 -1=-2.104, 
ху = 10“ +10 –1 = 0. 


Здесь учитывался тот факт, что с учетом ғ ~ 10-7 выражение под знаком кор- 
ня равно 10%. Чтобы избежать вычитания близких чисел, значение ху будем 
вычислять, как и прежде, а значение х, с учетом того, что произведение кор- 
ней равно д: 


х) =4=0.5.10—%. 


—$, 
Пример 3. Нужно вычислить значение е Е используя разложение экспо- 


ненты в ряд: 
2 3 
х 

ех =|1+х+—+——+... 
2731 


11 Зак. 3418 
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с относительной погрешностью промежуточных операций порядка ғ =10-? 
(более подробно см. [14], с. 27). Был получен ответ 0.0026363, в то время как 
истинный результат 0.00408677. В этом нет ничего удивительного, если за- 
метить, что соседние слагаемые разного знака, наибольшее по модулю сла- 
гаемое равно —41.942, и абсолютная погрешность только этого слагаемого 
соизмерима с итоговым результатом. Здесь влияние операции вычитания не 
сразу бросается в глаза, т. к. верные знаки исчезают не сразу, а в течение не- 
скольких последовательных операций. Избежать негативных эффектов мож- 
но, если воспользоваться тем же рядом для приближения экспоненты е?°, 
когда операция вычитания отсутствует совсем, а затем применить очевидное 


Ж ] 
равенство е 55 
е? 


Пример 4. Вычисление средней точки в методе бисекции (см. разд. 3.1). 
Пусть вычисления проводятся с тремя верными знаками мантиссы. А = 0.891, 
В = 0.893. Формула 


С = (4+ В)/2 = 1.78/2 = 0.89 
дает результат вне промежутка [4, В|, и формула 
С= А+(В – 4)/2 = 0.891 +0.002/2 =0.892 
оказывается более предпочтительной. В то же время для 4= 3.41, В = 8.73 
вторая формула 
С=А+(В-4А)/2 =-3.41+12.1/2 = –3.41 +6.05 =2.64 
уступает по точности первой 
С =(4А+ В)/2 = 2.66. 
И(51еп( А) = 5ісп(В)) еп С = (4 + В)/2еѕе С = А+(8 – 4)/2. 


П5.1.3. Конечные разности 
и суммирование функций 


Предметом упражнений является теоретический материал, содержащийся в 
разд. ПІ. 1—11.3. При этом можно воспользоваться табл. П5.1 и П5.2. 
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Таблица П5.1. Таблица разностей 


Е ИЕ Е ПИ 
іе –д 
7, 
1/ 


к 
Е _ 
ны бой 

агсір(о /(1 + о2 (Е + 1) 

20-1) *! за (К + 1)о)соѕ(о:/ 2) 


(1) соѕ((Е —1/2)а) 2-1)" соѕ(Ко) соз(а /2) 
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Таблица П5.2. Таблица сумм 
Л (К) > 7) 
к= 


—1 
Р 
п-р 
2 
"2 


ИЕ 

ЕЕЕ 

Рт: 

–2(1/(п(и + 1)) -1(р(р+1))) 

| ЕС” (т = П) (р "а т) 
но 

5 ((и- р)о/2)соѕ((и + р)о/2)/ѕіп(о/2) 
іп ((и- р)о/2)ѕіп((и+ р 1)0/2)/ѕіп(о/2) 
атсів(о(и – р) 1 + о2ир)) 


(= 1)" ѕіп((и +1/2)о) (1)? яш(Ср +1/2) а) 
2соѕ(о0/2) 


а" -а?)/(а- Г) 
п 
п — 


(ТИ т (К + Па) 


ба (-1)" соѕ(по) – (1)? соѕ(ра) 
(-1)  соѕ((& +1/2)о) КЕТТЕТ 
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В рамках этой темы рекомендуется также ознакомиться с методом неопреде- 
ленных коэффициентов, например, на основе следующих примеров. 


№ 
Пример 5. Вычислить значение суммы У соѕ(76 + 4). 
к=0 
Первообразную Е(К), удовлетворяющую (П1.8), будем искать в виде синуса 
с произвольными коэффициентами (А) = А5іп(Вё + С): 


АЕ(К) = А(ѕіп(Вк+ В+ С) – ѕіп(ВЕ+С)) = 


= 2 Аѕіп 5505 ВЕ + >. + с = с05(74 + 4). 


Отсюда В=7, С = 1/2, 4=1/(2:.511(7/2)). Значение Е(№ +1) – Е(0) и опре- 


деляет значение искомой суммы. 
м 2 
Пример 6. Вычислить значение суммы У К“. 
к=0 


Первообразную Р(А), удовлетворяющую (П1.8), будем искать в виде поли- 
нома третьей степени с произвольными коэффициентами 
Е(Ю) = АЮ + Вк? + СЕ: 


АЕ(Ю) = 4(0+1) -®)+ в((к +1)? 2 )+С = 
= 3А; +(34+28)а+д+В+С-= 02. 


Отсюда 4-5, В= =, СЕ оаа) 


- т . Для искомой суммы в 


итоге имеем 
М 
У р? О а АС ан Д 


В качестве самостоятельного упражнения рекомендуется убедиться в спра- 
ведливости следующего равенства: 
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П5.1.4. Линейное разностное уравнение 

порядка выше первого 

Предметом упражнений является теоретический материал разд. 11.4, начи- 
ная с формулы (П1.23). Здесь важно подчеркнуть глубокую связь между 
дифференциальными и разностными уравнениями, и возможно параллельное 


решение этих уравнений как для однородного случая, так и для неоднородно- 
го. Далее приводится вариант домашнего расчетного задания на эту тему. 


Расчетное задание. 
1. Решить линейное дифференциальное уравнение второго порядка: 


а?х 


Ет ТВА (Е) 
2 | 2 Фб). 


2. Решить линейное разностное уравнение второго порядка: 
а0Хџ+2 + Ху + ах, = Ф(и). 
Частное решение неоднородного уравнения в обоих случаях найти двумя 
способами: 
О подбором: 
О методом Лагранжа вариации неопределенных коэффициентов. 


Примечание. Коэффициенты ау, а, а, и функция Фф задаются преподава- 
телем. В качестве ф рекомендуется задать полином первой степени от и или 


{ соответственно. При этом для упрощения расчетов корни характеристиче- 
ского уравнения могут быть целыми (кратные или комплексные корни — на 
усмотрение преподавателя). 


П5.1.5. Интерполяция функций 


Построение полиномов Лагранжа и Ньютона может быть проиллюстрирова- 
но следующим расчетным заданием. 
Расчетное задание. 


Хорошо известная функция задана следующим фрагментом таблицы: 


тете нг 
ЗОНЫ 
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Необходимо: 
П угадать функцию; 
С вычислить оценку остаточного члена для точек 1/12 и 5/24: 


О построить интерполяционный полином в форме Лагранжа и в форме 
Ньютона; 


О в точках 1/12 и 5/24 вычислить значение интерполяционного полинома и 
реальные погрешности интерполяции (с учетом того, что исходная функ- 
ция известна) и сравнить их с оценкой остаточного члена; 


О графически изобразить распределение оценки остаточного члена и ре- 
альной погрешности на всем промежутке. 


Следует обратить внимание на последовательность построения "треуголь- 
ных" таблиц после формул (1.5.4) и (1.5.5). 


В начале разд. 1.6 отмечалось, что на практике интерполяционные полиномы 
высоких степеней строят крайне редко. В первую очередь, это связано с тем, 
что их коэффициенты очень чувствительны к погрешностям исходных дан- 
ных. Сравнительно малое изменение узлов интерполирования хұ или значе- 


ний функции /(х;) приводит к сильному изменению вида самого полинома. 
Иллюстрацией этого являются следующие примеры. 


Пример 7. Пусть в каждой точке таблицы с равноотстоящими узлами значе- 
ния функции /(х;) вычислены с погрешностью є (табл. П5.3). При этом в 
соседних точках эта погрешность имеет различный знак. 

Таблица П 5.3 


Саг шасе 


г 

М2 
ху 
+ 
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На практике типичной является ситуация, когда с ростом порядка конечной 


разности А величина А“ (х) убывает. Одновременно ее погрешность растет. 


Начиная с некоторого столбца, погрешность становится больше самой ко- 
нечной разности, и дальнейшее увеличение степени интерполяционного по- 
линома ни к чему хорошему не приводит. Этот пример может быть назван 
"излишне пессимистичным", т. к. погрешность во всех соседних точках име- 
ет разный знак, что является наиболее неблагоприятным. Поэтому обратимся 
к "оптимистичному" примеру. 


Пример 8. Здесь начальная погрешность имеется лишь в одной точке х; 
(табл. П5.4). 


Таблица П5.4 


врея р 
О Ш 


И, хотя для пятой конечной разности вместо величины д“ Хә – 32е получи- 


лось Д“ Ло +10=, погрешность неуклонно растет и распространяется по всем 
вышестоящим точкам. 


Пример 9. Построить систему уравнений для определения коэффициентов 
кубического сплайна (см. разд. 1.6). Исходная таблица имеет пять узлов. 
Здесь важно наглядно убедиться в том, что возникающая матрица системы 
является трехдиагональной. 


Пример 10. По заданной таблице построить систему уравнений для опреде- 
ления коэффициентов интерполяционного полинома Эрмита (аналогично 
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(1.7.1)). Можно также отметить особый случай полинома Эрмита с одним 
узлом интерполирования (1.7.4). 


П5.1.6. Численное дифференцирование 
и квадратурные формулы 


Для иллюстрации идеи, лежащей в основе получения формул численного диф- 
ференцирования (см. разд. 1.12), можно использовать следующий пример. 


Пример 11. Построить формулу для второй производной по четырем равно- 
отстоящим узлам таблицы. 


При вычислении интеграла по составным квадратурным формулам в разд. /.9 
был предложен следующий алгоритм. 


|. Задаемся начальным значением № и вычисляем интеграл по любой со- 
ставной квадратурной формуле, присваивая результат переменной Гц. 


2. Удваиваем величину № и вновь вычисляем интеграл, присваивая резуль- 


тат переменной Лех. 


3. Если значения / и Ге» совпали с заданной точностью, то прекращаем 


работу. В противном случае присваиваем переменной Гц значение Г, 


и возвращаемся к шагу 2. 
С использованием этой схемы может быть предложен следующий пример. 


Пример 12. Написать стандартную программу, вычисляющую значение ин- 
теграла от произвольной функции по составной формуле Симпсона (1.9.20) с 
заданной точностью $. 


Общий подход к построению квадратурных формул на основе метода неоп- 
ределенных коэффициентов и решение системы (1.10.2) отражают следую- 
щие примеры. 


Пример 13. Для стандартного промежутка [--1, 1] получить узлы и веса квад- 
ратурных формул Чебышева и Гаусса при 5 = 3. 

Пример 14. Квадратурные формулы Маркова характеризуются следующим 
свойством. Два узла равны пределам интегрирования (хү = а, х, = Б), а ос- 


тальные параметры, как и в формулах Гаусса, получаются решением системы 
(1.10.2). Построить квадратурную формулу Маркова с тремя узлами. (Резуль- 
татом является формула Симпсона.) 
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Представляется также полезным графически проиллюстрировать работу про- 
граммы обАмс8 по выбору переменного шага интегрирования на примере 
функции на рис. 1.5. 


П5.1.7. Среднеквадратичная аппроксимация 
и ортогональные полиномы 


Для иллюстрации этого материала можно решать систему (1.13.3) как для 
непрерывно, так и для таблично заданной функции при Ф, (х) = хб. В первом 
случае скалярные произведения записываются через интегралы, а во втором 
случае — через суммы. При обращении к ортогональным полиномам и про- 
цедуре Грама — Шмидта (см. приложение 2) вполне уместно изменить есте- 
ственный порядок исходных линейно независимых функций Ф, (х), напри- 
2 2 
мер, на 1, х, х*, х?,... Домашнее расчетное задание имеет следующий 
ВОЗМОЖНЫЙ ВИД. 
Расчетное задание. 


Дважды построить аппроксимирующий полином второй степени для функ- 


р 
ции с. хє [0, 1]. Сначала воспользоваться методом наименьших квадра- 
х+ 


тов в базисе х, 1, х? с непосредственным решением системы (2.13.3). Затем 


выполнить процедуру ортогонализации указанного базиса и построить поли- 
ном уже в полученном ортогональном базисе. Графически отобразить по- 
грешность аппроксимации. 


П5.1.8. Задачи на матрицы. 
Векторно-матричное решение систем 
дифференциальных и разностных уравнений 
на основе формулы Лагранжа — Сильвестра 


Выполнить следующие операции: 
4 8 12 0 
А=(2 -3 0) В=|3|5АВ=-1 ВА= 6 -9 0; 
2 3 0 
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2 0 —4 6 0 2 
230 1 1 =! 0 =. 225 = 2:. 2 
А = В= АВ = ВА = 
| ЕР = Ве”. 0 о 4-14 -3 
13 1 6 6 –2 


Решить матричные уравнения: 


Найти все матрицы, коммутирующие с данными: 


2а 2р 
К = | 
Е 2а+ 


100 а Ь 0 
А=0 1 0, АК= С а 0 |. 
а за Зе-За-с е-ЗБ-а е 


Найти собственные значения и собственные векторы заданной матрицы: 
4 —1 —2 ] | 
2 | —2|, №=1, № = 2, Аз =3; м = | 1 |, ы, = | 0 |, и; = | | 
1-1 1 ] | 0 

(Можно выполнить несколько примеров на иллюстрацию свойств матричной 

экспоненты из разд. 173.6.) 

Далее представлены возможные варианты домашних расчетных заданий. 

Расчетное задание. 

Решить аналитически систему линейных дифференциальных уравнений: 

ах. 

— = Ах+Ь, х(0) = х. 

а! 

Решить аналитически систему линейных разностных уравнений: 


хн = Ах, +6, Хх(0) = хо. 
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Необходимые матричные функции строить по формуле Лагранжа — Сильве- 
стра. Матрица А и векторы Б, ху задаются преподавателем. 


Расчетное задание. 


Для заданной матрицы А построить характеристическое уравнение и найти 
собственные значения, левые и правые собственные векторы. Для заданных 
векторов Ъ, ху получить аналитическое решение системы 


ах 
—= Ах+Ь, х(0)=х 
я (0) = хо 


в виде разложения по биортогональной системе собственных векторов. 


П5.1.9. Решение систем нелинейных уравнений 


Для решения системы нелинейных уравнений 
(х) = 0 
воспользуемся методом Ньютона (3.2.3). 


После предварительных упражнений на построение матрицы Якоби может 
быть предложено расчетное задание следующего вида. 


Расчетное задание. 


Решить систему нелинейных уравнений 
(хх) + 0.4) = х0, 
0.6х(2х0 2502) 0) = 1; х) > 0, х 0 


методом Ньютона с абсолютной погрешностью $ = 0.0001. Начальное при- 
ближение найти графически. 


Возможно использование различных модификаций метода Ньютона. 


П5.1.10. Устойчивость численных методов 
решения систем обыкновенных 
дифференциальных уравнений 


Эта тема является предметом лабораторного практикума, поэтому на практиче- 
ских занятиях можно ограничиться следующим иллюстративным примером. 
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Рассмотрим систему линейных однородных дифференциальных уравнений 


ах 

— = Ах, 1є[0, 3] 

аѓ 
с матрицей второго порядка, обладающей следующими собственными значе- 
ниями: Ау = –1, А =-20 000. Будем решать эту систему численно явным ме- 


тодом ломаных Эйлера (4.0.3), который в данном случае приобретает вид 
х =Х, НААХ, = (Е+АА)х, 
или 
х, = (Е+ ЛА)" хо. 


С другой стороны, точное решение исходной системы для дискретных значе- 
ний Г, = пй независимой переменной может быть записано следующим обра- 


зом 
Ар (АРҮ 
х(1,) =е "хә = (е Хо. 


Используя формулу Лагранжа — Сильвестра (см. (П3.16)), для точного и 
приближенного решения получаем соответственно 


х(/,) = (е^ ) Т хо + С ) Тху, 


х, = (1+ АА)" Тихо +(1+ АА, )" хо, 
где 
Т, = щу!, Т, =и2у>. 


Легко заметить, что успех численного решения полностью определяется точ- 


ностью аппроксимации экспоненты е" начальным отрезком ее ряда Тейло- 
ра (1+ ИА. ). В остальном обе формулы совпадают. 


Рассматриваемая система является жесткой. Исходя из условия устойчивости 
(4.3.2), шаг интегрирования должен строго удовлетворять неравенству 


р <10^. Однако проведем следующий эксперимент. Выберем первоначально 
достаточно малый шаг интегрирования, а когда пограничный слой 


(спс <103) будет пройден и второе слагаемое в решении практически ис- 


чезнет, увеличим шаг до й=0.1, что представляется достаточным для адек- 
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ватного описания первой экспоненты. Ясно, что условие устойчивости будет 
нарушено, но как в количественном плане будет вести себя решение? 


Первое слагаемое в точном решении выглядит следующим образом: 
(е) =“) =(0.90484)", 
а его аппроксимация в приближенном решении имеет вид: 
(1+ АА)" = (0.9)", 


весьма приемлемый для качественного представления решения. 


Иная картина наблюдается для второго слагаемого. Для точного решения 


( о^2й ) _ ( 272000 ) 


уже при и=1 это слагаемое пренебрежимо мало, а для приближенного ре- 
шения 


(1+ АА. )" =(-1999)" 


катастрофически быстро растет, увеличиваясь по модулю на одном шаге 
почти в 2000 раз! Даже если вне пограничного слоя задать начальные усло- 
вия так, что Тхи =0, из-за погрешности метода и ограниченного представ- 


ления в компьютере чисел с плавающей точкой возникнут малые ненулевые 
значения Т,х/, которые будут катастрофически возрастать с каждым шагом 


("взрыв погрешности"). 


А что в этом случае происходит с неявным методом ломаных Эйлера (4.0.4), 
рекомендованным для решения жестких систем? Для него имеем разностное 
уравнение 


—_] 
Х +] — Х М + ЙАх,.|, Хи | — (Е РА) х, 
ИЛИ 


Хх, 


— (Е ае РА) Хо, 


а использование формулы Лагранжа — Сильвестра приводит к выражению: 


Хуг рн Т хо + нЕ 38 Т> хо. 
И, ит 
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Как и для явного метода, его первое слагаемое аппроксимирует первое сла- 
гаемое точного решения вполне приемлемо: 


в 
а: (2) = (0.9091)", 
1 АА, 1.1 


а второе слагаемое имеет следующий ВИД. 


1 ү" р" 
— 49) = (0.0005). 
|- АА, 2001 


Разумеется, эта величина никакого отношения не имеет к величине 


п Е п 
(^^) =( 9) , 


но она быстро убывает с ростом пи и не позволяет возрастать возникающей на 
шаге вычислительной погрешности. 


П5.2. Лабораторные работы 


Лабораторные работы являются иллюстрациями к отдельным разделам курса 
с использованием программ из книги Дж. Форсайта, М. Малькольма, 
К. Моулера "Машинные методы математических вычислений" [14], обсуж- 
даемых в курсе лекций. 


П5.2.1. Интерполяция и квадратурные формулы 
(программы ЗРЫМЕ, ЗЕМАЁ, ОЦАМС8) 


В некоторых заданиях использование 5РЬТМЕ, ЗЕУАТ, С одной стороны, и 
ОПАМС8, с другой стороны, тесно взаимосвязано, а в некоторых — это относи- 
тельно независимые части работы. Часто для изучения ОЧАМС8 предлагаются 
интегралы, не имеющие конечного значения или содержащие подынтеграль- 
ную функцию с разрывами, для которых программа совершенно не предна- 
значена. Цель — изучить поведение программы в таких условиях. 


Вариант 1. Для функции /(х)=1-ехр(-х) по узлам х, = 0.36 (К =0, 1,..., 
10) построить полином Лагранжа /(х) 10-й степени и сплайн-функцию 5(х). 


Вычислить значения всех трех функций в точках у, = 0.15 + 0.34 (А = 0, 1,..., 9). 
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Результаты отобразить графически. Используя программу оолмсв, вычислить 
интегралы: 


| 
| (аБз(ѕіп(х) – 0.6))"ах , для т=-1 и для т=-0.5. 
0.5 


Вариант 2. Для функции /(х) =1-ехр(-х) по узлам х, = 0.35 (К=0, 1,..., 
10) построить полином Лагранжа /(х) 10-й степени и сплайн-функцию 5(х). 


Затем сравнить значения трех интегралов. 
ок; ео); ода. 
0 0 0 


Первый интеграл вычислить аналитически, а для вычисления последнего ис- 
пользовать оОоАМСв. 


Вариант 3. Для таблично заданной функции (х) 


1.1487 | 1.4142 | 1.6245 | 2.0000 | 2.4623 | 3.2490 | 4.0000 


построить сплайн-функцию и использовать ее для нахождения корня уравне- 
ния /(х)+5х-3=0 на промежутке [0, 2] методом бисекции. (Программа 


метода бисекции создается самостоятельно.) 


Вариант 4. Для 0<х<2 с шагом лй = 0.2 вычислить значения функции /(х) 


І 
с использованием программы оџамсв, где / (х) = [ех ѕіп(/)аї. По полученным 
0 
точкам построить сплайн-функцию и полином Лагранжа 10-й степени. Срав- 
нить значения сплайн-функции и полинома с точным значением (х) (вы- 


числить интеграл аналитически) в точках ху = (А – 0.5)ћ для К = 1, 2, ..., 10. 


П5.2.2. Решение систем линейных алгебраических 
уравнений (программы БЕСОМР и 501ҰБ) 


Здесь особое внимание уделяется исследованию зависимости погрешности 
решения от степени обусловленности матрицы. 
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Вариант 1. Матрица Х строится следующим образом: 


х ] 0 0 ... 0 
хх 1 0 0 
х х? х 1 0 

Х= 5 
хі х) ря х 0 
7 ] 
х" хт) 772 х" за. 5 


Построить матрицы А=ВЕ+Х и вычислить матрицы А! для х=2 и 
В = 1.0, 0.1; 0.01; 0.001 ит. д. вплоть до нештатной реакции компьютера. Размер 
матрицы Х равен 5х5. В вычислительном эксперименте возможно измене- 
ние параметра х. 


Вычислительный эксперимент состоит в исследовании связи априорной 
оценки "качества" заданных матриц, представленной оценкой стандартного 
числа обусловленности из программы ресомр, и апостериорной, вычисляемой 


п 
ь [А = тах >. [ау]. 
1 = 


Вариант 2. Матрица А формируется следующим образом: А = ВЕ + Н, где 


в ходе эксперимента: [в = [АА _Е 


а | 0 о... 0 
а? а 10 0 
о а? 0) ] 0 
Н = 3 2 
а’ а 0) 01 0 
| 
а" а"! о"? 0 Ф 


Решить линейные системы Ах, =Ъ, при В = 1.0, 0.1, 0.01 ит.д. вплоть до 
(р) 


нештатной реакции компьютера. Б; = : 
соѕ(/) 


‚ @“=2. Размер матрицы М = 4. 


В вычислительном эксперименте возможно изменение параметра ©. Срав- 


нить полученные решения с решением систем А? Ах, = АТЬ, полученных из 
исходных левой трансформацией Гаусса. 
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Априорная оценка качества заданных матриц представляется стандартным 
числом обусловленности Из программы РЕСОМР, а апостериорная 


$= |х –|/ х |. Использовать сферическую норму вектора. Результаты 


сравнения представить в виде таблиц и графиков. 


Вариант 3. Матрица А = (а, | формируется по следующему правилу: 


ар=1, (а= іжЈј), (а =а+ь і=ј 1), 
где © — параметр. 


Исследовать связь априорной оценки и апостериорных оценок "качества" 
матриц при решении линейной системы Ах, = двумя способами. Первое 
получить с помощью программ РЕСОМР и $01\Е, а второе — по формуле 
х) = АТ, где А7! также вычисляется с помощью программ ресомр и 501. 
Априорной оценкой считать стандартное число программы ресомр, а в каче- 
стве апостериорных взять относительную погрешность ё = |2, – Ху |/ |х, |. 


Размер матрицы № =7; а =0.9; 0.99; 0.999 и т. д. вплоть до нештатной реак- 


ции компьютера, Б = (1, 1, 1, ..., 1)Г. Возможно изменение компонентов век- 
тора Б. 


П5.2.3. Решение систем обыкновенных 
дифференциальных уравнений 
(программа РКРЕ45) 


Вариант работы. Решить систему дифференциальных уравнений: 


(1) 
А - —310х(0 —300х0 + — 20 
аі 101“ +1 
(2) 
2. = х0 + г 2", 


х( (0)=0; х(“)(0)=1; 1=[0, 0.4] 


следующими способами с одним и тем же шагом печати й, ., = 0.02: 


ргіпї 


О по программе &КЕ45 с & = 0.0001; 
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С методом Рунге — Кутты 4-й степени точности 


(К; +36, +3: + Ка). 
8 > 


Хи! = Хи т 


К, = (1х, ); камаа) 


к; мз, 21, нь, | Ка = А (1, + А, х, + К, -К. +К; 


с двумя постоянными шагами интегрирования: 
(С любой другой, позволяющий получить качественно верное решение. 


Сравнить результаты. Определить максимально допустимый по устойчивости 
шаг интегрирования для заданного метода. 


Примечание. Предлагаемый шаг 2; =0.01 заведомо нарушает условие ус- 
тойчивости. 


П5.2.4. Проблема собственных значений 
и преобразования Хаусхолдера и Гивенса 


Вариант 1. Написать стандартную программу, приводящую произвольную 
квадратную матрицу к форме Хессенберга на основе преобразования Хаус- 
холдера. Проверить ее на примере матрицы бх 6. 


Вариант 2. Написать стандартную программу, приводящую произвольную 
квадратную матрицу к форме Хессенберга на основе преобразования Гивен- 
са. Проверить ее на примере матрицы бх 6. 


Вариант 3. Написать стандартную программу, осуществляющую ОК- 
разложение произвольной квадратной матрицы. Проверить ее на примере 
матрицы бх б. 


Вариант 4. Написать стандартную программу, которая реализует ОК- 
алгоритм для нахождения всех собственных значений заданной симметриче- 
ской матрицы. (Используется программа, полученная в результате выполне- 
ния варианта 3.) Проверить ее на примере матрицы бх 6. 
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Вариант 5. Написать программу, находящую максимальное и минимальное по 
модулю собственные значения заданной матрицы с использованием прямого и 
обратного степенного метода. Проверить ее на примере матрицы бх 6. 


П5.3. Курсовая работа 


П5.3.1. Вычисление орбиты корабля "Аполлон" 


Рассматривается движение капсулы "Аполлона" на орбите около Земли и 
Луны [14]. Начало координат находится в центре масс Луны и Земли, за ось х 
берется прямая, проходящая через эти два тела, а расстояние между ними 
принимается за единицу. Координатная система перемещается при вращении 
Луны вокруг Земли. Если р — отношение массы Луны к массе Земли, то ко- 


ординаты Луны и Земли (1-ц, 0) и (-н, 0) соответственно. Массой "Апол- 


лона" пренебрегаем. (х, у) — координаты "Аполлона". 


1 
п (+6)? +02 )25 в = (-в* +7}; Е ЖЕ и* = – у; 


82.45 
* (х+ х-и* 
И. К ш ці а } 
А Р 
* 
у = 25+ В 
4 Р 


Построить траекторию полета на промежутке {є [0, 20] с начальными усло- 
ВИЯМИ х(0) =. х' (0) В: у(0) = у'(0) =. 
Построить графики и интерпретировать их. 


Оценить погрешность результата и влияние на точность траектории погрешности 
исходных данных. Значения 4, В, С, О определяются следующим образом: 


4 


| 
С = 040218305 ‚ р=-2.639594.х’, 


р ] (2 +1)(32 +4) 


где х — наименьший корень уравнения: 210 х +1 = а 4=1.2, В = 0. 
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П5.3.2. Решение краевой задачи 
методом стрельбы 


Решить нелинейную краевую задачу относительно у(х) на интервале 0 < х <1 


применив метод стрельбы, используя подпрограммы вВКЕ45 и 2ЕВОТМ 
(рис. 4.3). 

"Пристрелку" нужно вести по у'(0) в диапазоне стрельбы [4, В|. Значения 
А и В задаются следующим образом: 


0.2 е 
В = 0.046 | — 4; 4=1.2. 
01 х 


Оценить общую погрешность результата и влияние на точность результата 
погрешности исходных данных. 


П5.3.3. Решение краевой задачи 
конечно-разностным методом 
с использованием метода Ньютона 


Решить нелинейную краевую задачу относительно у(х) на интервале 0 < х <1 
а? 

СНУ -Ь 0(0)=0, >01) =А 

х 


методом Ньютона, предварительно сведя исходное уравнение второго поряд- 
ка к системе нелинейных алгебраических уравнений. С этой целью использу- 
ется аппроксимация 


г Е: А Хі == Хо + ій. 
При этом система принимает вид: 
2([.2 
Ут -2у,+ ул = (2-1, 11, 2, п-1, 


у= О, уһ = ЖК. 
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Решить эту систему для п=10 и п=20. Сравнить результаты. Оценить по- 
грешность результата и влияние на ее величину погрешности исходных дан- 
ных. При задании начального приближения для метода Ньютона приближен- 


но считать. что функция у(х) изменяется на промежутке |0. || линейно. 
р] Л 


Применение метода Ньютона к системе нелинейных алгебраических уравне- 
ний требует на каждой итерации решать систему линейных уравнений или 
обращать матрицу Якоби. Для этой цели использовать подпрограммы рЕсомр 
И ЗОГМЕ. 


Значения О и А задаются формулами: 
| 4 


9 
О=| | „х :еХах –0.026392602 |; 
0 


Ю=1.559554.2, где 2 — значение 2, минимизирующее функцию 


(2) =22(1-0.5* )+0.25 а (21) на промежутке [0.1; 1.0]. 


П5.3.4. Решение задачи 
параметрической идентификации 
(оценка параметров электрической цепи) 


Электрическая цепь описывается следующей системой дифференциальных 
уравнений: 


ар | 
А Ез -Ис+ь№ (К+), 
а 1 

и тт. (в +Ис +1 -5(№+№)), 
ай ПЕР 

И і). 


Размыкание ключа происходит в момент времени / = 0: 


| Е . 
100) =, (0) =0, Ис(0)=-Е.. 
] 
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При этом Д =: = и А = № = К. По заданной таблице экспериментальных 


данных оценить емкость конденсатора С с точностью до 0.0001 микрофара- 
ды. Воспользоваться подпрограммами Емтм и вкЕ45. Оценить точность ре- 
зультата и влияние на точность погрешности исходных данных. Значение С 


лежит в диапазоне от 0.5 до 2 микрофарад. В табл. П5.5 напряжение (.. дано 


в вольтах, а время — в миллисекундах. 


Таблица П5. 5 


рт 
О ОЕ ООО 
Т ЕТ НИ 
о ОЕ ОИ 
О ООО ООО 


Значения А, А, Е, являются решением системы уравнений: 


168 —18К, + 24Е, =304 
188 +49, – 42Е, =218 
248—428, +46Е, =166. 


Значения Ё, Ё задаются следующими формулами: 


им (1+х) 
[=0.1469517. |————ах 
0 


| 
1+х2 | 


Е =18.75217.х , где х’ — корень уравнения: е“ =2(х-1)?. 
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Примечание. В рамках этой работы предполагается построение алгоритма 
по схеме, подобной рис. 4.3 для метода стрельбы с заменой программы 


?ЕВОТМ на программу ғмІМ. Вызывающая программа мАТМ обращается к ЕМТМ 
для минимизации некоторой функции Е(С) в диапазоне С є [С С 
где емкость С выступает в качестве единственного входного параметра. Зна- 


чение функции Е(С), которую реализует пользователь, на выходе определя- 
ется в соответствии с формулой 

10 2 

Е(С)= >. (Ис@д- и 

к=0 
где /,, ИС“"(&) — экспериментальные данные таблицы, а Ис(1) — значе- 
ния решения системы дифференциальных уравнений при величине С, опре- 
деляемой значением входного параметра. Для получения Ис(1.) программа 
Е(С) вызывает процедуру вкг45, которая, в свою очередь, вызывает про- 
грамму вычисления производных решения #(/, х). 
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Дается представление о том, как строится программное обеспечение 

для обсуждаемых методов. 

Книга предназначена для студентов, аспирантов, преподавателей 

технических вузов и инженеров. 
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